-
"미래에는 데이터가 모든 판단의 기준이 될 것이다. 빅데이터는 사람의 사고방식을 예측해 만족할만한 결과를 제공하는 것은 물론, 머지않은 미래에 우리 삶 깊숙이 스며들게 될 것이다."
삼성전자 소프트웨어 전문가인 윤진수 삼성전자 소프트웨어센터 상무가 데이터의 중요성을 강조하며 빅데이터가 앞으로 생산과 마케팅, 서비스 할 것 없이 모든 분야에 영향을 미치는 핵심 결과물이 될 것이라는 의견을 밝혔다.
14일 삼성전자에 따르면 삼성소프트웨어센터에서는 데이터를 하나의 시스템으로 구축하고 있다. 여기저기 여러 부서별로 흩어져있는 데이터를 통합하고 그 결과에서 가치를 도출하는 작업을 진행하는 것이다.
윤진수 상무는 지난 1993년 삼성전자에 입사한 이후 소프트웨어 분야에서 근무해 온 베테랑이다. 지난 2013년 말부터는 소프트웨어센터에서 삼성전자 내 빅데이터 관련 프로젝트들을 총괄하고 있다.
윤 상무의 주요 임무는 삼성전자 내부 데이터를 통합해 효율적으로 활용할 수 있는 플랫폼을 만드는 것이다. 이렇게 가공된 데이터는 삼성전자 임직원이면 누구나 쉽게 쓸 수 있다. 대량의 데이터를 분석해 특정 부서가 필요로 하는 내용을 쉽게 찾아볼 수 있도록 가공하는 것도 그가 이끄는 조직의 역할 중 하나다. 삼성전자의 지식그래프 데이터 공개 프로젝트인 '케이샵(K#) 프로젝트'도 그 연장선상에 있다. -
삼성전자는 이렇게 도출된 빅데이터 결과물을 통해 삼성전자 고객용 보조 검색 서비스를 개발하겠다는 목표를 세웠다. 삼성전자 고객이 ‘삼성전자 웹사이트에 갔더니 다른 곳에서보다 훨씬 쉽게 제품 기능 등의 정보를 찾을 수 있더라’고 느끼도록 만들겠다는 것이다.
쉽게 예를 들면 삼성전자 TV와 디지털카메라를 사용하는 고객이 카메라로 촬영한 동영상을 TV 화면으로 보고 싶을 때 네이버나 구글을 검색하거나 삼성전자 고객센터에 전화를 거는 대신, 삼성전자가 제공하는 빅데이터 시스템 통합 프로그램을 통해 훨씬 간편하고 쉽게 해결방법을 찾을 수 있게 된다.
삼성은 인간과 가장 유사한 사고방식으로 데이터를 처리한 뒤 사용자가 원하는 답변을 직관적으로 내놓는 기술을 연구 중이다. 지식그래프가 바로 이 단계에 적용되는 기술이다.
지식그래프란 쉽게 얘기해 사용자가 검색한 키워드에 관한 콘텐츠를 총체적으로, 그리고 가시적으로 보여주는 '그래프화(化)된 지식'으로 정의된다. 검색엔진과 결합, 하나의 키워드에 관련된 데이터들과 그 관련성을 보기 쉽게 제시해준다. 사용자가 검색한 키워드 관련 지식을 통합적으로 보여주는 동시에 연관 키워드까지도 쉽게 찾을 수 있도록 해주는 소프트웨어인 셈이다.
지식그래프는 △출처가 서로 다른 대량의 데이터를 통합한 후 정리하고 △최종 사용자(end-user)의 요구 사항에 맞춰 그 결과를 일목요연한 콘텐츠 형태로 도출하는 요건을 충족시켜야만 한다.
-
삼성소프트웨어센터는 지식그래프를 구축하기 위한 기기와 고객 데이터를 모두 통합하며 통합된 데이터를 고객들의 수요와 발상에 맞춰 정리하는 작업을 수행하고 있다.
최근 PC와 모바일 기기 등의 사용 증가로 데이터의 양이 폭발적으로 늘면서 ‘어떻게 하면 일반 사용자의 사고 방식을 최대한 똑같이 따라갈 수 있을까?'가 데이터 선별 기준을 정하는 핵심 문제로 떠올랐다.
삼성소프트웨어센터는 ‘데이터의 연결성’ 개선을 통해 ‘삼성 제품의 연결성’을 높이는 것을 목표로 하고 있다. 그 과정을 통해 삼성 제품의 품질을 높이는 한편 최종 사용자의 제품 활용 수준도 한층 끌어올릴 수 있을 것으로 기대하고 있다.
삼성전자는 지식그래프 프로젝트인 '케이샵'을 통해 삼성전자형 지식그래프를 생성하는 것은 물론, 전세계 개발자들이 마음껏 뛰어놀 수 있는 집단지성 놀이터 구축에 힘쓰고 있다.
삼성전자는 지난달 개발자 커뮤니티 기트허브닷컴(GitHub.com)에 동의어 처리 데이터 ‘세임애즈(sameAs)’ 데이터를 올렸다. 이후로도 관련 소프트웨어를 추가로 공개, 전 세계 기술자들과 집단지성을 구축해나가겠다는 계획을 세웠다.
주목할 것은 삼성전자가 '폐쇄성' 대신 '개방성'을 택했다는 것이다. 삼성전자는 축적한 기술력과 노하우 등을 꽁꽁 숨기기보다 조건 없이 내놓고 타인이 마음껏 이용하도록 하고, 그 결과물 역시 자신이 자유롭게 활용하겠다는 방침을 내세웠다.
윤진수 상무는 "삼성전자는 한국을 대표하는 기업인 만큼 오픈 소스 환경을 비옥하게 조성하는 데 어느 정도 책임과 의무가 있다고 생각한다"면서 "혼자 만들 수 있는 것과 오픈 커뮤니티를 통해 만들 수 있는 것엔 양적으로, 또 질적으로 비교하기 어려울 만큼 큰 차이가 있다"고 강조했다.
그는 "현재 우리 센터에선 그런 부분까지 포함해 지식그래프 데이터와 소프트웨어 공개 등 일련의 작업을 전략적으로 추진하고 있다"면서 "아직 일부이긴 하지만 막상 소프트웨어를 공개하고 보니 외부에서 우리 회사를 보는 시각이 상당 부분 개선되고 있다는 걸 느낀다"고 평했다.
또 해외에서 관련 전문가를 확보하거나 연결하기도 쉬워졌고 삼성전자가 다루고 있는 영역이 워낙 넓은 만큼 앞으로 다양한 분야에 기여할 수 있을 것으로 기대했다.
마지막으로 윤진수 상무는 "삼성소프트웨어센터는 △우리의 고객(user) △우리 회사의 상품(product) △우리의 시장(market) △(휴대전화·TV 등의 제품을 통해) 우리 회사가 제공 중인 서비스를 중심으로 데이터를 지식화(知識化)해 나갈 것"이라면서 "이러한 노력을 통해 각 사업부가 필요로 하는 정보를 적재적소에 제공할 계획"이라고 밝혔다.
한편 삼성전자는 현재까지 확보한 데이터(sameAs)를 공개한 데 이어 이달 중 데이터를 만들기 위해 필요한 도구(sameAs extraction tool)를 공개할 예정이au, 지식기반 그래프를 검색하고 추천하는 API(Application Programming Interface)를 9월과 10월, 12월에 단계별로 선보일 계획이다.