네이버 하이퍼클로바X, 성능평가서 글로벌 오픈소스 앞질러

폐쇄형 대비해서도 우수한 점수 획득다국어 능력 확인, 안전한 개발 노력

▲ ⓒ네이버

네이버는 ‘하이퍼클로바X’의 테크니컬 리포트를 통해 글로벌 AI 모델과 비교해 우수한 성능평가를 기록했다고 4일 밝혔다.

테크니컬 리포트는 학습 방법이나 성능 등 AI 모델의 세부 정보를 소개하는 논문이다. 오픈AI, 구글과 같은 빅테크 기업들도 자사 AI의 특징을 테크니컬 리포트를 통해 설명하고 있다.

리포트에 따르면 하이퍼클로바X는 성능 평가에서 글로벌 오픈소스 모델보다 높은 종합 점수를 획득했다. 특히 한국어, 일반상식, 수학, 코딩 부문에서는 리포트에서 비교 평가를 위해 선정한 14개 모델 중 1위를 기록했다. 특정 국가 언어 능력뿐만 아니라 보편 지식, 프로그래밍 등 다양한 분야 문제 해결력까지 갖춘 ‘소버린 AI’로서의 경쟁력을 입증했다.

폐쇄형으로 개발된 모델들과의 비교에서도 하이퍼클로바X는 우수한 점수를 획득했다. 한국어 능력 부문에서는 세계 최고 수준 모델을 포함해 선정된 4개 모델 중 1위에 올랐고, 영어 능력 분야에서도 같은 모델들 중 2위를 기록했다.

리포트는 하이퍼클로바X의 학습 과정에 대해서도 설명했다. 사전학습 데이터는 대부분 한국어, 영어, 코드 데이터로 구성돼 있다. 양질의 사전학습 데이터 구축을 위해 매우 짧거나 반복적인 저품질 문서는 데이터셋에서 제외했고, 개인정보가 포함된 데이터도 삭제했음을 확인할 수 있다.

리포트에서 강조된 하이퍼클로바X의 또 다른 특징은 ‘다국어 능력(Multilinguality)’이다. 일본어, 아랍어, 힌디어, 베트남어를 비롯한 아시아 국가 언어 능력을 평가했을 때, 하이퍼클로바X는 주요 오픈소스 모델을 포함해 리포트에서 선정한 9개 모델 중 가장 높은 점수를 획득했으며, 중국어에서만 같은 모델들 중 2위를 기록했다.

유강민 네이버클라우드 리더는 “특정 문화권에 더 적합한 배경지식과 함께 다국어 능력까지 보유해 한층 활용도가 높은 소버린 AI의 가능성을 하이퍼클로바X가 보여주고 있다”고 설명했다.

하이퍼클로바X의 안전성을 위한 노력도 리포트에 소개됐다. 사회적 이슈와 편향, 불법적 행동 등 민감하거나 위험한 주제를 설정해 질의 데이터를 수집하고, 이를 기반으로 레드티밍(Red-teaming)을 수행해 모델의 취약점을 보완했다. 또한 하이퍼클로바X 윤리 원칙에 기반해 혐오, 편향, 저작권 침해, 개인정보 등의 콘텐츠는 생성하지 않도록 지속적으로 개선하고 있다.

성낙호 네이버클라우드 하이퍼스케일(Hyperscale) AI 기술 총괄은 “하이퍼클로바X 구축 경험을 활용해 향후 다양한 지역과 국가의 특화 초대규모 AI를 만드는 데에도 적극적으로 나설 것”이라고 말했다.

네이버 하이퍼클로바X, 성능평가서 글로벌 오픈소스 앞질러

이 시각 주요뉴스