7억장 규모 데이터셋 ‘코요’ 학습, 텍스트-이미지 변환창작 도구 활용, NFT화 등 산업 활용 가능성편파 데이터 학습·명령어 입력 제한 ‘한계’
-
카카오 판교 아지트 1층 로비 한가운데 열린 미술품 전시회, 주역은 다름 아닌 AI 아티스트 ‘칼로’다. 작품을 한참 감상하던 중, 카카오브레인 관계자가 “이미 작품 한 점은 판매됐다”고 귀띔했다.19일 업계에 따르면 5일부터 16일까지 카카오 판교 아지트에서 ‘Karlo’s Moment‘ 전시회가 진행됐다. 작품을 온·오프라인으로 판매하는 한편, 판매 수익금 일부는 카카오창작재단에 기부한다.칼로는 이미지 생성 AI 모델로서, 데이터셋 ’코요‘를 통해 약 7억 4000만개 이미지와 텍스트를 온라인에서 수집·학습했다. 특히 학습을 통해 미술사조와 더불어 작가의 화풍과도 같은 창작기법도 내재화했다. 텍스트의 문맥을 바탕으로 도출하는 결과물은 기존에 존재하는 이미지를 찾아내는 형태가 아닌 새로운 창작물을 생성한다는 데 의의가 있다.칼로는 텍스트를 입력하면 이미지로 변환해서 출력한다. 텍스트의 조건을 상세하게 입력할수록, 출력하는 결과물도 정밀해진다. 예를 들어 ‘cat’이라고만 적으면 이미지 형태의 고양이가 나올 뿐이지만, ‘wearing a hat’이나 ‘ anime’ 등 입력값을 추가하면 정교한 형태의 결과물을 내놓는다.전시회에 출품한 작품은 총 7점으로 이 중 5점은 칼로의 작품이고, 2점은 두민 작가와의 협업 작품이다. 이 중 판매된 작품은 ‘코요’로, 칼로가 태어난 코요 행성의 모습을 표현한 작품이다. 비주얼적 요소와 색채를 이용해 칼로가 가진 창의성의 근원으로 코요 행성의 모습을 담았다.전시회에 출품한 칼로의 작품들은 모두 캔버스에 9개 구획으로 나눠졌다. 카카오브레인 관계자는 “칼로 모델의 최대 1024×1024 해상도로 인해 칸을 나누게 됐다”며 “전시회 이름처럼 칼로가 명령어에 따라 포착한 9개의 순간을 담았다는 의미도 있다”고 설명했다.작품 ‘확산’은 칼로가 지구의 말과 언어를 학습하는 과정을 표현했다. 인간의 감각기관으로 눈을 형상화한 ‘구(球)’형태와 뻗어나가는 선이 반복적으로 나타나며 학습 방식을 형상화했다. 또 다른 칼로의 작품 ‘수직적 조우’는 칼로가 지구를 바라본 모습으로, 무채색의 네모 반듯한 건물들이 중첩돼서 나타나는 전형적인 도시의 모습을 그렸다.칼로와 같은 AI 모델은 예술가들의 창작 도구로 활용하는 데 도움을 줄 전망이다. 카카오브레인 관계자는 “칼로와 협업한 두민 작가는 30여개 명령어를 입력해 작품의 전반적인 분위기와 스케치를 구상했다”며 “노트르담 성당과, 성모 이미지를 담은 밑그림을 바탕으로 두민 작가의 수정과 채색작업을 거쳐 작품을 완성했다”고 전했다.칼로를 이용해 브랜드 로고 디자인이나 시각자료에 적용하는 등 활용 가능성은 무궁무진하다는 전언이다. 저작권 이슈에서 자유롭기 때문에 칼로가 생성한 결과물을 마음대로 사용해도 된다는 설명이다. 도출한 이미지에 추가 작업을 통해 NFT화 할 수 있는 여지도 남아있다.다만 칼로 모델은 편향된 데이터로 인한 한계도 분명하다. 칼로가 바라본 지구의 모습은 아파트와 고층 빌딩으로 이뤄진 ‘도시’ 이미지에 한정됐다. 여성 이미지를 그려달라고 하면 대부분 서양인을 형상화한 모습을 출력하는 식이다.데이터 입력도 한글이 아닌 영어로만 가능하다. 학습한 데이터가 영어와 서구권을 바탕으로 하는 구글 클라우드의 GPU를 활용하기 때문이다. 한글로만 표현할 수 있는 명령어 입력이 제한될뿐더러, 이용자 접근성도 떨어지는 부분이다.칼로는 추가 학습을 진행하며 고도화할 예정이다. 이미지에서 불필요한 부분을 제거하는 ‘인페인팅’과 더불어 기존 이미지에서 주변부를 상상해 이미지를 확장하는 ‘아웃페인팅’ 등 기능을 추가할 계획이다. 고도화한 결과물은 오픈 API 형태로 공개하며 생태계 저변 확장에도 기여할 방침이다.김일두 카카오브레인 대표는 “아트투게더, 두민 작가와의 협업은 칼로의 창의성과 예술성을 입증할 수 있는 좋은 사례”라며 “뛰어난 예술가와의 협업을 통해 인간의 상상력을 자극하는 도구로 AI 기술을 적극 활용하며 공생 관계를 다질 계획”이라고 말했다.