전작 두 배 수준 추론 성능 강화경쟁 모델 벤치마크 압도
  • ▲ ⓒ구글
    ▲ ⓒ구글
    구글이 ‘제미나이 3 프로’의 추론 능력을 강화한 ‘제미나이 3.1 프로’를 공개했다.

    20일 업계에 따르면 이번 모델은 기존 제미나이 3 프로 대비 추론 성능을 두 배 이상 끌어올렸다. 단순 답변만 아니라 어려운 과제에 활용할 수 있는 고급 추론 능력을 제공한다는 설명이다.

    이 모델은 새로운 논리 패턴 해결 능력을 평가하는 ‘ARC-AGI-2’ 성능지표에서 77.1%를 기록하며 전작(31.1%) 대비 두 배 이상 높은 점수를 얻었다. 경쟁작인 오픈AI의 GPT-5.2(52.9%)와 앤트로픽 클로드 오퍼스 4.6(68.8%)보다 높은 수치다.

    코딩 능력을 평가하는 ‘SWE-벤치 베리파이드’에서도 최고 수준으로 평가받는 오퍼스4.6(80.8%)과 비슷한 수준인 80.6%를 기록했다. 학술 추론 능력을 측정하는 ‘인류의 마지막 시험’(HLE)에서도 도구 미사용 기준 점수 44.4%를 획득하며 GPT-5.2(34.5%)와 클로드 오퍼스 4.6(40%)에 앞섰다.

    제미나이 3.1 프로는 이날부터 사용 가능하며, 일반 소비자 대상 서비스는 유료 요금제 이용자에게 우선 제공된다.