테스트-SQL 변환 모델, BIRD-SQL 글로벌 리더보드 1위정확도-효율성 모두 GPT 4 상회…"종목 스크리닝 성능 향상 기대"
-
두나무의 AI 모델이 정확성과 속도 측면에서 글로벌 리더보드 1위에 올랐다.블록체인 및 핀테크 전문기업 두나무는 자사 머신러닝팀이 연구·개발한 텍스트-SQL 변환 모델이 글로벌 AI 모델 평가 지표인 BIRD-SQL에서 글로벌 리더보드 1위를 달성했다고 25일 밝혔다.텍스트-SQL 변환 모델은 사람의 언어를 데이터 관리 프로그래밍 언어인 SQL로 변환하는 AI 모델로, 생성형 AI의 등장 이후 큰 관심을 받는 연구 분야다.두나무 머신러닝팀이 이번에 개발한 텍스트-SQL 모델은 사용자가 자연어로 질문을 입력하면 SQL 변환이 필요한 데이터를 빠르고 정확하게 추출, 챗GPT의 성능을 한층 강화하는 것이 특징이다.특히 AI 모델 성능 측정 벤치마크인 BIRD-SQL의 글로벌 리더보드에서 정확도 점수 65.4%, 효율성 점수 71.3%를 각각 받으며 모두 1위에 올랐다.이는 GPT-4의 정확도(54.8%)와 효율성(60.7%)을 각각 10%p 이상 상회하는 수치다. 2위 모델과도 정확도 항목에서 4.7%p, 효율성에서 3.6%p의 높은 성능 격차를 기록했다. 처음 1위에 오른 1월14일 이후 현재까지도 계속 선두를 지키고 있다.이번 연구를 통해 증권플러스에서 제공하는 AI 대화형 서비스 '우디'의 자연어를 통한 종목 스크리닝 성능을 크게 향상할 수 있을 것으로 기대된다.이동준 두나무 머신러닝팀장은 "챗GPT로 촉발된 생성형 AI 기술 개발이 활발해지면서 보다 정교하게 자연어를 이해하고 누구나 쉽게 기술을 활용할 수 있도록 연구하고 있다"며 "명령어에 따라 성능이 크게 달라지는 거대언어모델(LLM)의 한계점을 개선하는 데 초점을 맞춰 다양한 서비스 향상에 이바지하도록 노력하겠다"고 말했다.한편 두나무 머신러닝팀은 주식과 디지털 자산 시장에서 활용되는 AI 모델을 연구·개발하고 있다. 현재 AI 모델링 및 튜닝, 모델 평가 매트릭 설정 등 다양한 데이터를 발굴해 두나무의 다양한 서비스에 활용하고 있다.