온디바이스 활용 가능, 한국어·이미지 해석 특화3B 파라미터 모델과 비슷한 수준 성능 갖춰
-
- ▲ ⓒNC AI
NC AI가 온디바이스 환경에서 구동 가능한 초경량 멀티모달 AI 모델 ‘VARCO VISION 2.0 1.7B’를 공개했다고 30일 밝혔다.바르코 비전 2.0은 이미지와 텍스트를 함께 이해하며 질문에 답할 수 있는 차세대 인공지능 모델이다. 여러 장의 이미지를 동시에 분석할 수 있어 복잡한 문서나 표, 차트도 효과적으로 처리할 수 있다.이번 경량 모델 공개는 16일 공개된 중형 모델 '바르코 비전 2.0 14B'에 이은 것이다. 14B 모델은 공개 후 열흘 만에 1만회 가까운 다운로드를 기록하며 국내외 개발자들의 높은 관심을 끌었다.바르코 비전 2.0 1.7B는 텍스트 처리, 한국어 성능에서 글로벌 톱 오픈소스 멀티모달 모델인 InternVL3 2B, Ovis2 2B 등을 압도했다. 영문 텍스트 처리 MT-Bench와 한국어 K-SEED, K-LLaVABench는 물론 광학문자 판독 CORD, ICDAR 등 벤치마크에서 글로벌 모델들의 성능을 넘었다.바르코 비전 2.0 1.7B는 여러 주요 벤치마크에서 2배 가까이 더 큰 규모의 국내 모델들과 어깨를 나란히하는 성능을 기록했다. 특히 대학 수준의 지식을 검증하는 MMMU 벤치마크와 과학 차트 이미지 해석 능력을 평가하는 AI2D 벤치마크에서 카카오의 카나나 3B, 네이버의 하이퍼클로바 3B 등 3B급 멀티모달 모델들과 동등하거나 더 뛰어난 성능을 보였다.NC AI는 1.7B 모델도 오픈소스로 공개한다. 앞서 국내 AI 생태계 발전과 연구 활성화에 기여하기 위해 바르코 비전 2.0 모든 모델을 연구용 오픈소스로 공개한다고 밝힌 바 있다.이연수 NC AI 대표는 “경량 고성능 모델 개발 능력을 통해 다양한 국내 산업군의 경쟁력을 크게 높일 것”이라며 “바르코 비전 2.0 1.7B는 AI 기술의 자립과 민주화를 위한 중요한 이정표로 더 많은 사람들이 쉽게 접근할 수 있는 고성능 AI 모델 개발에 최선을 다하겠다”고 말했다.





