기계판독 문서화로 빅데이터·인공지능 활용 확대
  • 한글과컴퓨터(이하 한컴)와 한국문화정보원(이하 문정원)이 공공문화데이터 개방을 위해 협력한다고 3일 밝혔다.

    문정원은 한컴과의 민관협력을 통해 개방형 문서 형식인 HWPX 전환에 적극 동참해 문화 분야 공공데이터 개방을 위한 잰걸음에 나선다는 전략이다.

    한컴은 지난 15일 '아래아한글' 문서의 기본형식을 개방형인 HWPX로 변환하는 정기패치를 실시했다. 기계판독형(머신리더블, Machine Readable)인 HWPX 문서는 별도의 처리 과정 없이도 데이터의 분류·추출이 가능해 빅데이터 분석과 인공지능 분야에서의 문서 활용도를 크게 높일 수 있다.

    한컴과 문정원은 이번 협력을 통해 문정원이 운영·관리하는 각종 문화 예술 분야의 공공문서들을 개방형 문서이자 기계판독이 가능한 HWPX 형식으로 변환하는데 앞장섬으로써 공공문화데이터의 빅데이터화를 통해 더욱 효과적인 개방과 민간 활용 확산을 가속화 해나갈 계획이다.

    문정원과 한컴은 지난해 공공저작물로 개방한 안심글꼴 69종을 한컴오피스에서 저작권 걱정없이 편리하게 사용할 수 있도록 협력한 바 있다. 그 결과 작년 한 해에만 150만명 넘게 안심글꼴을 이용하는 성과를 거뒀다. 안심글꼴 개방을 위한 문정원과 한컴의 민관협력 사례는 2021년 문화체육관광부의 소속·산하 기관 대상의 '정보화업무 수준평가' 우수사례로 선정되기도 했다.

    김대기 한컴 부사장은 "머신리더블한 개방형 문서가 빠르게 확산될 수 있도록 총력을 다 할 예정"이라며 "공공에서 생산되는 데이터들이 보다 안전하고 효율적으로 활용될 수 있는 기반 조성을 위해서 공공과 적극적으로 협력해 나갈 계획"이라고 밝혔다.