멀티모달 강화, AI 어시스턴트 강조한국어 해석, 인식 능력 떨어져논란 될 만한 내용은 답변 회피
  • ▲ ⓒ구글코리아 블로그
    ▲ ⓒ구글코리아 블로그
    한국어 이해 능력이 부족하고, 논란이 될 만한 내용을 언급하거나 환각 현상이 일어날 것을 사전에 차단하기 위해 답변을 회피하는 AI. 구글이 출시한 생성형 AI 제미나이 2.0의 현주소다.

    17일 업계에 따르면 구글은 제미나이 1.5를 선보인 지 약 10개월만에 새로운 버전 2.0을 내놨다. 기존 대비 2배 빠른 응답속도와 높아진 정확성이 특징이다. 데스크톱과 모바일웹에서 사용할 수 있고, 모바일 애플리케이션에도 곧 적용될 예정이다.

    제미나이 2.0 ‘플래시’ 실험 버전은 모든 사용자에게 무료로 공개됐다. 이미지와 오디오 등 멀티모달(다중형식 처리) 입력과 출력 기능이 강화됐고, 텍스트로 이미지 생성도 가능하다. 다만 사람 이미지를 생성하는 것은 유료 버전인 ‘어드밴스드’에서만 지원한다.

    무료 버전 제미나이에 구글 드라이브에 업로드 한 ‘2025학년도 수능 국어 영역’을 PDF 파일로 입력했다. 경쟁사 오픈AI가 출시한 챗GPT ‘o1’ 모델은 만점을 맞았다는 문제다.

    홀수형 모든 문항을 제시했는데 제미나이는 그중 8개 문제에 대한 답변만 내놨고, 정답률은 50%였다. 틀린 문제 지문에 기호가 있어 해석하기 어려웠다고 생각했는데, 오답을 내놓은 다른 문항에는 온전히 텍스트만 표기돼 한국어 능력이 부족한 것으로 파악됐다. 제미나이가 오답을 정답으로 판단한 이유에 대해 설명한 내용을 보니 자가당착에 빠진 모습이었다.

    주유소에 차가 세워진 사진을 제시하고 묘사를 요청했을 때도 한국어 인식 능력이 떨어지는 것을 확인할 수 있었다. 해상도가 높은 사진임에도 제미나이는 차량 번호판에 ‘더’라고 쓰인 글자를 ‘허’로 읽었다. 그래도 주변 배경과 차종을 정확히 인식하고, 어둑해진 하늘을 통해 사진이 찍힌 시간대를 유추하는 등 글자 인식률 외에는 흠잡을 데 없었다.

    제미나이는 선거와 정치적인 내용에 대한 답변은 제공하지 않았고, 사진에 인물이 포함됐을 때 묘사와 판단은 배제했다. 앞서 내놓은 버전이 다른 생성형 AI 모델과 비교해 답변 내용의 부정확성이 상대적으로 두드러졌기 때문으로 풀이된다. 잘못된 데이터를 내놓거나 사실이 아닌 정보를 사실인 것처럼 말하는 ‘환각’ 현상을 최소화하고, 논란이 될 만한 내용은 아예 답변하지 않는 방식을 택했다.

    지메일과 구글 드라이브, 지도는 물론 유튜브까지 확장프로그램을 연동한 기능을 통해 AI 어시스턴트로서 면모를 엿볼 수 있었다. 입력창에 구어체로 명령어를 작성하면 드라이브에 있는 파일을 확인하거나 문서를 요약하는 것도 가능하다. 흰옷에 묻은 얼룩을 지우는 방법을 소개한 영상을 유튜브에서 찾아달라고 하면 관련 동영상을 찾아주며, 조회 데이터도 유튜브 기록과 연동돼 추천 알고리즘에 반영된다.

    제미나이는 매 답변마다 ‘2.0 플래시 실험 버전이며, 예상대로 작동하지 않을 수 있다’는 팻말을 내걸었다. 아직 생성형 AI를 활용한 답변 내용이 불완전하고 오류가 있을 수 있음을 상기시킨다. 생성형 AI는 다양한 기능을 연동해 AI 어시스턴트로 활용 가능하고 작업 시간을 줄이는데 도움을 주지만, 그만큼 사용자 주의가 필요하다.