카카오, AI-머신러닝 등 연구 성과 및 기술 공유 컨퍼런스 개최데이터모델링 기법으로 다양한 과학적 난제 해결AI 학계, 스타트업, 연구 기관들과 함께 대규모 AI 모델 도전
  • ▲ 김일두 카카오브레인 대표 ⓒ카카오
    ▲ 김일두 카카오브레인 대표 ⓒ카카오
    방대한 데이터를 기반으로 하는 데이터모델링 기법 발달이 미래 인공지능(AI) 연구의 키워드로 떠올랐다.

    카카오는 17일 ‘카카오브레인 오픈 미니 컨퍼런스’를 개최하고 AI, 머신러닝 등 카카오브레인의 최신 연구 성과와 기술 노하우, 미래 비전 등의 내용을 공유했다.

    김일두 카카오브레인 대표는 이날 ‘앞으로 인공지능이 어떤 일들을 더 잘할 수 있을까요?’의 발제를 통해 데이터모델링의 성장이 우리의 삶에 큰 변화를 가져왔다고 말했다.

    김 대표는 “인식, 경우의 수, 추론 이미지 인식 등을 통해 머신러닝의 기능성이 부각됐고 그 이후에 수많은 응용 사례들이 쏟아져 나왔다”며 “이러한 인식과 데이터모델링에서의 성장이 경우의 수가 아주 많은 문제를 풀어나가기 시작했다”고 말했다.

    특히, 김 대표는 데이터모델링 기법의 발달이 과학적 난제 해결을 비롯한 인류 발전에 기여하고 있다는 점에 주목했다.

    김 대표는 “데이터에 대한 인식과 데이터모델링 기법의 향상으로 수많은 경우의 수를 탐색해야 하는 문제들이 잘 풀려나가고 있다”며 “단백질 접힘 문제를 포함해 다양한 과학적 난제 등 인류의 발전에 기여하고 있다”고 설명했다.

    석차옥 갤럭스 대표 역시 김 대표와 유사한 의견을 밝혔다. 석 대표는 “구글 딥마인드의 알파폴드가 지난 2020년 단백질 구조 예측 난제를 풀었다”며 “AI가 난제를 풀 수 있었던 이유는 아주 많은 지식이 녹아들어 있기 때문이다”라며 데이터의 중요성을 강조했다.

    이어 “복잡한 시스템을 간단한 수식으로 표현할 수 없고 계산 과정에서 오차가 생길 수 있다. 때문에 이미 자연이 만들어 놓은 데이터에 기반한 AI를 통해 배우는 것이 난제를 해결하는 옳은 방법이란 생각을 하게 됐다”고 말했다.

    머신러닝 기술의 발전을 위해 도전적인 연구 과제들을 수행해야 한다는 의견도 나왔다. 김 대표는 “머신러닝 기술이 한 발짝 더 나아갈 수 있는 방향 중 하나로 대규모 모델에서 도전하고 있다”고 말했다.

    이를 위해 카카오브레인은 최근 60억 파라미터의 ‘한국어 언어 모델(KoGPT)’을 오픈소스로 공개한 것에 이어 300억 파라미터의 한국어 언어 모델을 추가로 공개했다. 한국어 언어 모델이란 한국어를 사전적, 문맥적으로 이해하고 이용자가 원하는 결과값을 보여주는 모델이다.

    국내 최대 규모의 이미지 생성 모델 ‘민달리’ 역시 오픈소스로 이번 주에 공개했다. 카카오브레인은 향후 글로벌 최대 규모의 이미지 텍스트 모달 데이터셋을 구축하고 모델과 함께 공개할 계획이다.

    김 대표는 “언어 모델은 챗봇뿐만 아니라 문서 검색 요약 분류 등 다양한 태스크에 사용될 수 있는 기반 모델”이라며 “다양한 곳에서 응용해주시고 모델의 문제점도 드러내서 함께 해결하고 단점을 극복하기 위해 함께 고민해 보았으면 한다”고 말했다.

    카카오브레인은 다양한 연구 기관과 함께 대규모 AI 모델에 도전해 사람 같은 인공지능을 향해 도전하겠다는 계획을 공개했다.

    김 대표는 “세상의 가장 중요한 문제에서 이 기술들이 쓰이도록 노력하고 싶다. 적어도 교육과 헬스케어 분야에서 하이테크 기반으로 난제성 이슈를 많이 해결할 수 있을 것 같다”며 “이 분야가 아니더라도 많은 자극이 카카오브레인, AI 학계, 스타트업들에게 필요하다. 많은 스타트업들과 연구 기관에서 관심과 에너지를 모아 세상을 바꿀 고민들을 함께 해 나갔으면 좋겠다”고 말했다.