SemTabGPT: 초거대 언어모델을 사용한 지식그래프 기반 시맨틱 테이블 인터프리테이션

Jeongsu Kim, Jungkyu Han, Sejin Chun (2023). 2023 한국소프트웨어종합학술대회

Keywords
Domestic Conference

Abstract

Tabular data의 중요성이 증가함에 따라. 이를 해석하는 연구가 꾸준히 진행되고 있다. 이때까지 진행되었던 대부분의 연구는 Tabular data의 구조화된 특징을 사용하여 Interpretation 하기 위해 Knowledge Graph를 사용하여 Tabular data의 Cell, Column, Property에 대하여 Matching을 진행하였다. 이를 본 논문에서는 Large Language Model을 통해 추가적인 데이터를 가져와 활용하고, 기존에 있던 구조적인 방법론을 Prompting으로 구현하는 구조를 제안한다. 실험 결과 유의미한 결과가 도출되었고, 이를 통하여 Tabular data Interpretation 작업에 대한 Large Language Model의 가능성을 확인할 수 있었다.

Highlights