한국어 특화 LLM 평가서 경쟁력 입증순수 자체개발 의의, 시장 확산 본격화
-
- ▲ ⓒKT
KT는 자체 개발 모델 믿:음 2.0 Base가 한국어 LLM 평가 지표 ‘호랑이 리더보드3’에서 파라미터 수 150억개 미만의 국내 기업 모델 중 성능 1위를 기록했다고 9일 밝혔다.믿:음 2.0 Base의 종합 점수는 0.7197로 글로벌 동급 모델 중에서는 3위에 해당하는 성과다.‘호랑이 리더보드’는 글로벌 MLOps 기업 웨이트앤바이어스(W&B)가 주관하는 한국어 특화 LLM 평가 벤치마크다. 실제 한국어 환경에서의 범용적인 언어 이해력과 응답 안전성을 포함하는 정렬성(Alignment) 등 한국어 LLM의 실용적인 역량을 다면적으로 평가한다.특히 한국어 고유의 문맥, 표현, 사회적 맥락 등을 반영한 응답인지를 평가한다는 점에서 국내 시장에서의 실효성을 가늠하는 데 중요한 기준으로 꼽힌다. 평가 결과는 W&B가 운영하는 WanDB 플랫폼을 통해 투명하게 공개돼 신뢰성을 높였다.이번 성과로 믿:음 2.0이 국산 기술력 기반의 한국어 AI 모델로서 실질적 경쟁력을 갖추었음을 객관적으로 입증했다. KT는 믿:음 2.0을 개발하며 한국의 정신과 생활방식, 지식과 사회적 맥락을 반영해 한국에 가장 잘 맞는 AI로 학습시켰다.믿:음 2.0은 아키텍처 설계부터 데이터 구축, 학습까지 전 과정을 KT가 직접 수행하는 ‘프롬 스크래치’ 방식으로 개발한 순수 자체 개발 모델이라는 점에서도 기술적 의미를 더한다.신동훈 KT Gen AI Lab장(상무)은 “믿:음 2.0을 국내 다양한 산업 분야에 적용해 ‘한국적 AI’의 시장 확산에 본격적으로 나설 것”이라며 “한국적 AI의 실용화와 기술 발전을 이끄는 핵심 주체로 자리매김하겠다”고 말했다.





