구글 이용정책 변경… "공개된 데이터 AI에 학습"네이버 "자사 데이터 학습 안 한다고 단정 못 해"저작권법, 정보통신망법 위반 소지 등 정책 지원 절실전담 기관 문체부·과기부·등 걸쳐있어...통합 대응 필요
  • ▲ 구글ⓒ연합뉴스
    ▲ 구글ⓒ연합뉴스
    구글이 이달부터 공개된 데이터를 인공지능(AI) 학습에 이용하겠다고 공식 선언했다. 이에 네이버는 국내 플랫폼의 데이터가 해외의 인공지능을 학습시키는데 무단으로 쓰여선 안 된다며 정책적 지원을 요청하고 있다. 

    14일 관련 업계에 따르면 구글은 이달 1일부터 개인정보 처리 방침을 변경하고 “공개된 데이터로 구글의 AI 모델을 학습시키는 데 이용한다”고 명시했다. 국내 플랫폼의 데이터가 구글의 AI 학습 사정권에 놓이면서 네이버는 우려의 목소리를 내고 있다. 

    네이버 관계자는 “오픈AI나 구글 등 초거대 AI를 공개한 기업에서 네이버를 포함해 국내 플롯폼을 통해 생산된 데이터를 전혀 학습하지 않았다고 단정하기는 어렵다”며 “이 데이터를 해외 기업들이 제약 없이 사용할 수 없도록 정책적인 지원이 필요하다”고 말했다. 

    네이버가 오는 8월 24일 공개할 초거대 AI ‘하이퍼클로바X’는 유창한 한국어가 가장 큰 장점이다. 뉴스 50년치, 블로그 9년치에 달하는 데이터를 입력해 챗GPT 대비 6500배 더 많은 한국어를 학습했다. 하지만 구글의 AI가 네이버의 데이터를 학습할 시 언어장벽이 허물어질 수 있다. 

    관련 볍령상 타 플랫폼의 데이터를 ‘크롤링’ 등의 방법으로 무단 수집 시 저작권법 및 정보통신망법 등에 저촉될 수 있다. 하지만 네이버는 현실적으로 대응이 어렵다는 입장이다. 

    네이버 관계자는 “구글이 데이터를 학습했다고 해도 거기다 대고 뭐라고 얘기할 수 있는 것은 사실 (어렵다)”고 말했다. 이어 “저작권법은 문화체육관광부에서 담당하고, 여러 군데에 다 걸쳐 있다”고 말했다. 즉 정부의 통합 대응이 절실하다는 것.

    해당 사안과 관련해 저작권법은 문체부, 정보통신망법은 과학기술정보통신부, 개인정보보호법은 개인정보보호위원회에서 개별적으로 다루고 있다. 하지만 최근 구글의 이용정책 변경을 시작으로 데이터 주권이 화두로 오르면 세 기관은 통합 대응을 고려 중인 것으로 확인됐다.

    개보위 관계자는 “조만간 정책 방향을 발표할 예정”이라며 “주제가 연결돼 있기 때문에 문체부 및 과기부와 공동 발표 여부, 발표 일정 등을 조율하고 있다”고 말했다.