AI 학습용 데이터 구축 위한 정부 주도 프로젝트대교, 수학문제와 정답, 풀이과정 등 30만건"교육용 초거대언어모델 기반을 마련"
  • ▲ ⓒ대교
    ▲ ⓒ대교
    대교가 ‘2023 인공지능(AI) 학습용 데이터 구축 사업’을 마무리하며 우수 평가를 받았다고 29일 밝혔다.

    해당 사업은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 추진하는 정부 주도 프로젝트다. 디지털 대전환의 핵심 자원인 AI 학습용 데이터를 구축하고 개방함으로써 인공지능 생태계를 조성하기 위해 마련됐다.

    대교가 이번 사업을 통해 구축한 AI 학습용 데이터는 ▲다양한 유형의 수학 문제와 정답 ▲학습자의 손글씨 풀이 과정 이미지 등 약 30만건에 달한다.

    대교는 지난해 7월 이번 사업에 컨소시엄 주관기관으로 참여해 수학 과목 자동 풀이 데이터, 수학 과목 문제 생성 데이터 등을 구축했다. 여기에 구축된 데이터를 활용해 총 6종의 AI 모델을 개발하고 한국정보통신기술협회(TTA) 품질 검증을 거쳐 데이터 품질 관리와 신뢰성을 높였다.

    대교 관계자는 “이번 사업은 AI 학습용 데이터가 상대적으로 부족한 교육산업에 고품질의 최적화된 수학 문제 데이터 등을 제공함으로써 교육용 초거대언어모델(LLM)의 기반을 마련했다는 데 의의가 있다”고 설명했다.