중국 모델 도용 의혹 전면반박, 공개 검증회 개최의혹 제기한 고석현 대표에 공개 사과 요구“투명한 기술 공개로 AI생태계 확장 일조”
-
- ▲ ⓒ업스테이지
정부 주도 국가대표 AI 개발 프로젝트에 참여 중인 업스테이지가 중국 모델을 도용했다는 의혹에 대해 즉각 사실이 아니라고 맞섰다.2일 업계에 따르면 업스테이지는 이날 오후 업계 전문가들을 초청해 AI 모델 ‘솔라 오픈’에 대한 공개 검증회를 개최했다.전날 국내 스타트업 사이오닉AI의 고석현 대표가 솔라 오픈을 파생 모델이라며 의혹을 제기한 것에 대한 반박이다. 고 대표는 오픈소스 공개 플랫폼 깃허브와 SNS 링크드인에 업스테이지 ‘솔라 오픈 100B’가 중국 AI기업 Z.ai 모델과 구조적 패턴에 유사성이 있다고 언급했다. 고 대표는 “국민 세금이 투입된 프로젝트에서 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델이 제출된 것은 상당히 큰 유감”이라고 비판했다.이에 김성훈 업스테이지 대표는 반박하는 글을 게재하며 공개 검증회를 예고한 바 있다. 기존 모델을 활용한 것이 아니라 백지 상태에서 모델을 설계하는 전 과정을 직접 수행했음을 입증하겠다는 것. 김 대표는 “솔라 오픈 100B가 중국 모델을 복사해 미세조정한 것으로 추정된다는 글은 사실과 다르다”며 “솔라 모델은 명백히 프롬 스크래치 방식으로 학습했다”고 주장했다.업스테이지는 공개 검증회에서 기술적 유사성 논란을 해소하기 위해 모델 학습 로그와 체크포인트, 완디비(Wandb, 실험 기록)를 공개했다. 체크포인트와 완디비는 모델 개발에 있어 일종의 ‘육아일기’이며, 로스(Loss)가 높다는 데서 프롬 스크래치 방식을 입증했다. AI모델은 처음 개발 시 백지상태이기 때문에 질문에 대한 오답률이 높다는 것.또한 일부에서 제기한 레이어 연결고리인 ‘레이어놈’ 유사성을 근거로 타 모델의 가중치를 재사용했다는 주장은 통계적 착시에 불과하다고 설명했다. 해당 구간은 모델 전체의 약 0.0004%에 불과한 미세 영역이며, 솔라 오픈의 99.9996%가 타 모델과 상이함을 보여주는 역설적 지표라는 점에서다.업스테이지는 정규화를 통한 모델 특성을 반영하는 ‘피어슨 상관계수’로 재분석한 결과, 솔라 오픈과 타 모델 간 패턴이 전혀 일치하지 않는다고 증명했다. 솔라 오픈이 타 모델의 가중치를 재사용하지 않은 독립적 모델임을 뒷받침하는 통계적 근거다.특정 모델과 구조·코드가 유사하다는 지적 역시 기술적 현실과 맞지 않다고 주장했다. 공개된 모델 카드나 구조 설명을 참고해 아이디어를 얻는 것은 가능하지만, 접근 자체가 불가능한 학습 코드를 재사용해 모델을 개발한다는 주장은 기술적으로 성립할 수 없다는 것.김 대표는 사이오닉AI 고석현 대표에 대해 공개 사과를 요구하기도 했다. 김 대표는 “의혹을 제기한 리포트에 오류가 있었다”며 “오류가 명확한 부분에 대해서는 공개 사과를 요청할 것”이라고 말했다.이어 김 대표는 “의견을 주고 받는 건강한 토론은 환영하나 허위 사실을 단정적으로 전달하는 행위는 AI 3강을 향해 최선을 다하고 있는 정부 노력 의미를 심각하게 훼손하는 것”이라며 “앞으로도 투명한 기술 공개를 바탕으로 글로벌 최고 수준의 기술력을 증명하고 국내 AI생태계 확장에 힘쓰겠다”고 덧붙였다.현재, 업스테이지는 국가대표 AI를 선발하는 정부 주관 ‘독자 AI파운데이션 모델 프로젝트’에 정예팀으로 참여 중이다. 정부는 이달 15일 전까지 1차 평가를 마치고 탈락자 한 팀을 선발하겠다는 계획이다.





