자체 ‘풀스택 AI’ 역량 확보, 저작권·안전 문제 다룬 경험 갖춰모델 성능보다 비즈니스 수요 창출 중요, 옴니모달로 대응각각 다른 AI에이전트 연결하는 데이터 ‘은행’ 역할 자처
-
- ▲ ⓒ네이버클라우드
네이버클라우드가 소버린AI와 AX라는 단어를 처음 만들어낸 기업으로서 자부심을 드러냈다. 이번 프로젝트를 계기로 ‘옴니모달’에 기반한 AI에이전트 플랫폼을 구현하겠다는 복안이다.성낙호 네이버클라우드 하이퍼스케일 AI 총괄은 지난 12일 인터뷰를 통해 K-AI 프로젝트 정예팀 평가에서 살아남기 위한 전략과 향후 방향성을 공유했다.업계에서는 네이버클라우드를 선발된 5개 정예팀 중 LG AI연구원과 ‘탑2’로 분류한다. 앞서 글로벌에서 세 번째로 거대언어모델(LLM) ‘하이퍼클로바’를 개발했고, 서비스까지 구현한 경험을 보유했기 때문이다. 모델 개발뿐만 아니라 산업 적용과 범국민 대상 ‘모두의 AI’ 구현까지 최적화된 역량을 갖췄다는 평가다.성낙호 총괄은 네이버클라우드 컨소시엄의 최대 강점이자 차별점을 ‘풀스택 AI’로 꼽았다. 네이버 자체로 클라우드와 데이터센터부터 서비스로 가치를 만들어내는 것까지 가능하다는 점에서다. 성 총괄은 “LLM을 만드는 능력만 아니라 B2B와 B2C를 모두 포괄하는 역량을 갖추고 있다”며 “반도체도 업체들과 협업한 경험이 있고 전력에 필요한 에너지 정도를 제외하면 AI 밸류체인에서 5분의 3 정도는 직접 하고 있다”고 강조했다.뿐만 아니라 생성형 AI에서 가장 문제가 되는 저작권과 안전성 문제도 다뤄봤다는 점을 차별화 포인트로 제시했다. 성 총괄은 “프롬스크래치 방식만 아니라 저작권과 세이프티를 핸들링 해본 기업은 국내에 거의 없다”며 “프로젝트에 도전한 다른 기업들은 그런 문제에 직면한 경험이 전혀 없는 기업들이 대부분일 것”이라고 덧붙였다.불과 몇 년 전만 해도 중요하게 다뤄지지 않았던 ‘소버린 AI’와 ‘AX’ 개념도 모두 네이버가 만들었다는 전언이다. 성 총괄은 “JP모건이 예측한 AI의 파급력은 국가 GDP의 7% 수준에서 최근에는 20%까지 보고 있다”며 “데이터 주권 개념을 바탕으로 AI 주권이라는 말을 만들었고, GDP의 많은 영역을 AI가 차지한다면 AI를 사용하는 부(富)도 영내에 머물러야 한다는 취지”라고 설명했다.정예팀 경합과 최종 2팀 선발 과정에 있어서 모델 성능 확보에 중점을 둔 평가보다는 비즈니스 수요 창출이 더 중요하다고도 제언했다. AI 모델 성능이 어느정도 평준화된 현재 상황에서 GPU가 확보되면 나올 수 있는 모델의 성능은 비슷하다는 점에서다.성 총괄은 “AI모델 개발에 필요한 스케일과 레시피 모두 중요하지만 GPU를 지원받아서 파운데이션 모델을 만들어도 사실상 쓸 데가 없으면 안된다”며 “큰 비용이 들어가는 하이엔드 시장을 공략할 것이 아니라 주권을 내주지 않을 정도로 소버린 AI를 확보하고 경량 모델을 중심으로 개발할 필요가 있다”고 전했다.네이버클라우드가 이번 프로젝트를 통해 제시한 ‘옴니 파운데이션 모델’은 모델 벤치마크 성능에만 치중하는 것이 아닌 산업과 실생활에 적용가능한 AI가 되기 위함이다. LLM은 텍스트를 기반으로 만들어졌기 때문에, 눈에 보이고 움직이는 것들을 이해하기 쉽지 않았다. LLM을 고도화한 VLM(멀티모달 모델)도 텍스트에 이미지를 추가 학습해 환각 현상이 자주 발생했다.옴니 모달리티는 처음부터 글과 이미지, 비디오를 함께 학습한 모델로서 기존 언어모델과 차별화됐다. 예를 들어 네이버 지도의 거리뷰를 학습한 옴니 모델은 자율주행이나 피지컬AI에 적용하는 데 훨씬 유용하다는 의미다. 영상 AI 기술을 보유한 ‘트웰브랩스’를 기업 중 유일하게 컨소시엄에 포함시킨 것은 옴니 모델 실현을 위함이다.네이버클라우드는 플랫폼 기업으로서 역량을 살려 ‘AI에이전트 플랫폼’으로 자리매김하는 것을 목표로 하고 있다. 다양한 에이전트를 모아서 각각 에이전트를 쓸 때 비용을 최대한 낮추는 구조를 만든다는 취지다. 성 총괄은 “향후에는 각기 다른 데이터를 기반으로 한 AI에이전트가 여러 개 있을 것으로 생각한다”며 “기업 간 데이터와 API를 서로 공유하지 않기 때문”이라고 전했다.옴니 모달리티로 학습한 파운데이션 모델은 텍스트가 아니더라도 예를 들어 CCTV나 IoT(사물인터넷) 등 다양한 데이터를 통해 나의 정보를 잘 이해하는 AI 에이전트로 진화한다. 에이전트 간 데이터가 공유되지 않는 상황에서 사용자가 소유권을 가진 암묵지 데이터, 즉 ‘라이프 롱 로그’를 다른 에이전트로 이전한다는 취지다.성 총괄은 “에이전트 간 데이터를 이전할 때 비용이 많이 발생하면 활성화가 안 되기 때문에 사용자 기록을 옮길 때 권한을 주는 구조가 필요하게 될 것”이라며 “에이전트의 플랫폼을 만들어 민감한 개인정보를 안전하게 보관할 수 있는 은행으로서 역할을 해보고 싶다”고 피력했다.네이버클라우드는 옴니 모달을 구현하기 위해 데이터 학습과 활용 제약 해소가 선행돼야 한다는 입장이다. 성 총괄은 “프롬 스크래치 역량에서 중요한 것은 회색지대에 있는 저작권 영역으로 현재 대부분 이미지 생성 AI 모델은 어떤 데이터를 학습했는지 아무도 밝히지 않고 있다”며 “정부가 방송 등 한정된 부분에서는 학습해도 된다고 정해줬으면 한다”고 말했다.





