적은 데이터, 단일 모델 제작글로벌 AI 기술력 입증
  • ▲ ⓒ엔씨
    ▲ ⓒ엔씨
    엔씨가 게임 음성제작 AI 모델 ‘Zero-shot Multi-verse TTS(이하 멀티버스 TTS)’를 공개했다고 8일 밝혔다.

    TTS(Text to Speech)는 자연어를 입력해 캐릭터 목소리 같은 음성 콘텐츠를 제작하는 음성 합성 기술이다. 멀티버스 TTS는 ▲다양한 발화 스타일 변환 ▲화자 음색 일치도가 높은 교차 언어 생성 ▲다국어 음성 제작이 가능하다.

    엔씨는 멀티버스 TTS 기술을 게임 음성 제작 과정 전반에 활용할 계획이다. 해당 모델을 활용하면 제한된 음성 리소스를 활용해 AI 캐릭터 보이스 제작이 가능하다. 기존 음성 작업보다 시간과 비용을 절감할 것으로 기대된다.

    단일 모델로 구동이 가능한 점도 특징이다. 멀티버스 TTS는 여러가지 언어와 기능을 가진 TTS를 하나의 모델로 제공해 다국어 음성 콘텐츠를 제작한다. 경쟁 TTS 모델에 비해 상대적으로 적은 운용 비용으로 고품질의 음성 생성 서비스가 가능하다.

    엔씨 관계자는 “글로벌 게임 출시를 위해 다국어 음성 AI 연구개발에 매진하고 있다”며 “연내 100종의 게임 캐릭터 음성을 제작하고, NPC의 성격과 상황에 맞춰 음성을 제작하는 조절 기능을 지속 개발하는 것이 목표”라고 말했다.