SKT·LG연구원·업스테이지, 이달 독파모 2차 AI 모델 개발 종료업스테이지, 프리뷰 버전 벤치 공개 “프런티어 모델 따라잡았다”SKT·LG연구원, 에이전트 기능 강화 모델 선보일 전망
  • ▲ 지난해 12월 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회의 모습.ⓒ뉴데일리DB
    ▲ 지난해 12월 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회의 모습.ⓒ뉴데일리DB
    정부의 독자 AI파운데이션 모델(이하 독파모) 프로젝트 2차 평가 시점이 다가오면서 AI 업계의 긴장감이 높아지고 있다. 독파모 1차 평가를 통과한 SK텔레콤과 LG AI연구원, 업스테이지가 이달 말 AI 개발 종료를 코앞에 두고 있기 때문. 이들 사업자는 이번주 중 최종 버전의 AI모델을 내놓을 전망이다.

    유력 최종 후보로 꼽히는 3사였던 만큼 이 AI 모델이 어느 정도의 성능을 보여줄지는 앞으로의 관전포인트다. 특히 최근 AI모델 경쟁에서 본격화된 ‘에이전틱 AI’ 기능은 2차 평가의 당락을 좌우할 것이라는 전망이 지배적이다.

    23일 AI 업계에 따르며 이달 말 예정된 독파모 2차 AI 모델 개발 종료를 앞두고 AI 업계는 촉각을 곤두세우고 있다. 독파모 2차 심사는 오는 8월로 예정돼 있지만 SKT와 LG AI연구원, 업스테이지의 AI 개발기한은 6월까지다. 

    독파모 추가 참여사로 선정된 모티브테크놀로지스의 개발 기간이 오는 7월까지로 잡히면서 독파모 1차를 통과한 3사는 최종 AI 모델을 선보이고도 한 달을 기다려야 하는 상황이 됐다. 업계에서는 이 기간이 평가 아닌 평가를 받는 전초전이 될 것으로 보고 있다.

    이미 프리뷰 버전 AI 모델에 대한 윤곽이 드러나는 중이다.

    업스테이지는 최근 독파모 AI 모델인 ‘솔라 오픈2’ 프리뷰 버전이 AI 성능평가 기관 아티피셜 애널리시스 인텔리전스 지수(AAII)에서 44.4점을 기록했다고 밝힌 바 있다. 

    AAII는 AI 모델 추론과 에이전트 활용, 지시 이행 등 고난도 성능을 종합해 AI 모델 프런티어 근접도를 수치화한 지표다. ‘솔라 오픈2’가 얻은 점수는 앤트로픽 ‘클로드 소넷 4.6’, 오픈AI ‘GPT-5’와 유사한 수치로 프랑스의 AI모델 ‘미스트랄’을 앞섰다.

    아직 ‘솔라 오픈2’가 프리뷰 버전인 만큼 최종 버전에서는 이 성능을 상회할 가능성도 있다. 업스테이지는 이르면 이번주 최종 버전을 내놓을 예정이다.

    주목할 점은 업스테이지가 프리뷰 버전의 타우2-벤치(τ²-bench) 기준 98%라는 점수를 공개했다는 것이다. 타우2-벤치는 기존의 단순 질의응답을 넘어 AI 에이전트가 사용자가 상호작용하며 실제 현장 업무를 완수하는 능력을 측정한다. 앤트로픽의 최신 AI모델인 ‘페이블 5’이 98.5%를 받은 것에 근접한 수준을 이룬 것. 

    AI모델의 지능이 상승하면서 에이전틱 AI로서의 기능을 강점으로 제시했다는 평가다. 

    SKT의 독파모 2차 AI 모델인 ‘A.X K2’에 대한 구체적인 벤치마크는 공개되지 않았지만 방향성은 업스테이지와 마찬가지로 ‘에이전틱 AI’에 맞춰지고 있다. SKT는 최근 독파모 선행연구 세미나를 진행하면서 ‘A.X K2’가 수학 문제 풀이와 코딩 등 에이전트 기능을 비롯해 모델 활용과 산업 확장에 적합한 성능을 갖출 예정이라고 밝힌 바 있다.

    특히 SKT는 이 과정에서 산업현장에 활용할 수 있는 경량화와 높은 효율 등을 강조할 것으로 알려졌다.

    LG AI연구원은 독파모 1차 평가에서 벤치마크·전문가·사용자 평가 전 항목 1위를 차지했던 ‘K-엑사원(K-EXAONE)’의 새로운 버전을 준비 중이다. 특히 지난 4월 텍스트와 시각정보를 이해하는 멀티모달 ‘엑사원 4.5’를 공개하며 단순한 생성 능력을 넘어선 산업현장에서 쓸 수 있는 에이전트의 청사진을 보인 바 있다.

    독파모 1차를 통과한 3사가 ‘에이전틱 AI’에 방점을 맞추는 것은 최근 AI 시장 경쟁이 ‘에이전틱 AI’로 전환되고 있다는 점도 주효했지만 독파모 2차 평가가 멀티모달 및 피지컬 AI 확장을 세부 평가 지표로 보고 있기 때문이다. 

    특히 산업 적용성 및 활용성을 핵심으로 평가할 예정이다. 이를 위해서는 AI 스스로가 계획을 세우고 도구를 활용하면서 복잡한 문제를 자율적으로 해결할 수 있는 ‘에이전틱 AI’ 능력이 필수적이다. 

    업계 관계자는 “생성형 AI가 상호작용을 통해 자연어 처리를 통한 답변을 줬다면, 그 다음 영역은 에이전틱 AI를 통해 정교한 추론과 계획을 통해 산업 전반의 생산성과 운영 효율을 상승시키는 것”이라며 “독파모 1차 평가가 독자 AI의 가능성을 봤다면 2차 평가는 활용에 방점이 맞춰졌다”고 말했다.