거대언어모델 기반 Conflict-Free Replicated Data Type을 사용하여 분산 테이블의 의미적 어노테이션 일관성 보장

Wonseok Son, Sejin Chun, Jungkyu Han (2025). 2025 한국통신학회 동계종합학술발표회

Keywords
Domestic Conference

Abstract

최신 협업 응용들은 다수 사용자들이 함께 일관된 편집이 가능하도록 CRDT(Conflict-free Replicated Data Types)를 채택해 왔다. Last-Write-Wins(LLW)와 같은 보편적인 CRDT는 동기화 과정에서 분산 데이터를 병합하고 구조 측면에서 일관성을 보장한다. 하지만, 기존 방법은 다른 사용자가 같은 의미이지만 다른 내용을 업데이트할 때 의미론적 불일치가 발생하고 이는 잘못된 의사결정을 초래할 수 있다. 이를 해결하기 위해. 본 연구는 거대언어모델(Large Language Model: LLM)과 함께 CRDT를 확장함으로써 테이블 데이터의 열 간 의미적 관계를 해석하고, 의미적 불일치를 제거하는 방법론을 제안한다. 제안 방법은 분산 환경에서 구조적 일관성뿐만 아니라 의미적 일관성까지 확보할 수 있다.