클로바X 이미지 처리능력 업데이트, 멀티모달 AI로 진화수학 문제풀이, 사진 속 상황 추론·분석…정확도 아쉬워에이전트 서비스 확대, 사용자 데이터 기반 고도화 숙제
  • ▲ 대화창에 이미지 검색 기능이 추가됐다 ⓒ클로바X 웹페이지 캡처
    ▲ 대화창에 이미지 검색 기능이 추가됐다 ⓒ클로바X 웹페이지 캡처
    네이버 클로바X가 텍스트만 아니라 이미지도 인식할 수 있는 ‘멀티모달’ AI로 거듭났다. 복잡한 표와 그래프를 분석하고, 수학 문제도 풀이하는 실력은 다른 생성형 AI 모델과 비교해도 손색이 없는 수준이다. 다만 일취월장한 실력에도 미흡한 완성도는 숙제로 남았다.

    네이버는 27일 대화형 AI 서비스 클로바X에 시각 정보 처리 능력을 업데이트했다. 이미지 파일을 대화창에 업로드하면 상황을 분석, 묘사해 텍스트로 출력하는 방식이다.

    이번 업데이트는 텍스트 위주로 활용 범위가 한정됐던 생성형 AI ‘하이퍼클로바X’의 영역을 넓혔다는 데 의의가 있다. 글자만 쓰인 책에 글의 내용이 정밀하게 묘사된 삽화가 추가된 형상이다.

    네이버는 데이터에 기반한 이미지 인식 기술을 꾸준히 고도화해왔다. 쇼핑렌즈나 그린닷의 스마트렌즈를 통해 이미지를 업로드하면 제품을 안내하거나 사물을 인식하는 서비스를 통해 인식 정확도를 높였다.

    클로바X의 수준 높은 이미지 분석력과 정확도를 입증하기 위해 수능 모의고사 문제를 활용했다. 네이버는 클로바X에 초·중·고등학교 검정고시 총 1480개 문항을 AI 모델에 이미지 형태로 입력하고 문제를 풀게 했다. 약 84%의 정답률을 기록하며 오픈AI GPT-4o의 78%보다 높은 정답률을 보였다고 강조한 바 있다.
  • ▲ 업데이트 전과 후 이미지 검색 가능여부에 대한 답변이 달라졌다 ⓒ뉴데일리 김성현 기자
    ▲ 업데이트 전과 후 이미지 검색 가능여부에 대한 답변이 달라졌다 ⓒ뉴데일리 김성현 기자
    특히 이미지 인식 능력을 종합적으로 판단하기 위해 도형으로 된 수학 문제 위주로 제시했다. 6월 모의고사 문항을 제시하자 클로바X는 수학 문제집 해설지처럼 계산식과 풀이 과정을 늘어놨다.

    클로바X는 문제의 정답은 맞췄지만, 결과값이 상응하지는 않아 당황하게 만들었다. 정답에 해당하는 번호는 알려주는데, 풀이한 결과로 나온 값은 번호에 있는 숫자와 달랐다. 클로바X에게 번호에 명시된 답이 맞지 않느냐고 묻자, 아니라면서 틀린 답을 다시 제시했다.

    다른 문항을 대입하더라도 결과는 마찬가지였다. 문제의 답을 찾아내는 것은 어렵지 않게 수행했지만, 완성도는 떨어지는 모습이었다. 하지만, 챗GPT도 같은 문항을 입력했을 때 아예 답을 틀리거나 잘못된 결과값을 출력하는 경우가 많다는 점은 감안할 필요가 있다.

    수학 문제 외에도 이미지를 업로드하면 유명인들에 한해 누구인지 알려주거나, 장소가 어딘지 파악하는 것도 가능했다. 엔씨의 신작 ‘호연’ 이미지를 업로드했더니 ‘원신’이라고 하는 등 정확하지 않거나 왜곡된 정보를 출력하는 환각 현상도 일부 나타났다.

    클로바X는 한 명의 여성이 포함된 사진을 제시하고 여성이 몇 명이 있는지 묻자 4명이 있다고 하며 엉뚱한 대답을 내놓기도 했다. 성별을 구분하는 것은 생성형 AI 기반 모델들의 공통된 숙제로 보인다. 챗GPT는 똑같은 사진을 보여줬을 때 아예 답변을 회피했는데, 성별 관련된 질문은 데이터가 적어 판단 자체가 어렵거나 위험성이 높다고 분류하는 것으로 풀이된다.

    전반적인 완성도로 볼 때 아직 클로바X는 미흡한 점이 많다고 볼 수 있다. 서비스로 내놓은 만큼 사용자 데이터가 쌓이며 고도화된다면 향후 더욱 개선될 것으로 예상된다.
  • ▲ 클로바X가 이미지에 대한 질문에 틀린 답변을 내놓는 모습 ⓒ뉴데일리 김성현 기자
    ▲ 클로바X가 이미지에 대한 질문에 틀린 답변을 내놓는 모습 ⓒ뉴데일리 김성현 기자
    클로바X는 3시간 내 30개 대화를 제공하는데, 이미지 대화는 업로드 가능 횟수에 제한이 없다. 챗GPT는 이미지를 몇 개만 업로드 하더라도 이내 3시간 뒤 사용 가능하다는 메시지를 출력한 것과 대비된다. 과도한 신체 노출이나 이용정책을 위반하는 이미지는 업로드가 금지된다.

    문서이해 도우미와 AI 지우개로 분류된 ‘에이전트 서비스’도 제공한다. 문서를 업로드하면 요약, 분석하거나 이미지의 지우고 싶은 부분을 자동으로 제거해주는 서비스다. 기존 클로바X에서도 제공된 기능이지만 좀 더 개선하고 대상 사용자를 확장한 모습이다.

    네이버 관계자는 “이전에 있던 기능을 개선한 것으로, 특화된 기능을 사용해볼 수 있다”며 “AI 지우개는 전체 사용자 중 일부 사용자만 한정해서 제공했던 것을 전체 클로바 이용자를 대상으로 늘렸다”고 전했다.

    클로바X는 챗GPT처럼 모바일로도 사용할 수 있다. 네이버는 크롬 웹브라우저를 통해 접속하면 모바일에서 이용할 수 있다고 안내한다. 별도 애플리케이션은 아니지만, 웹에서 사용한 이력이 그대로 연동되고 모바일 환경에 맞는 사용자 환경(UI) 최적화도 이뤄져있다.