사전테스트, 작업통제 부재 원인 지적카카오 “겸허히 수용, 재정비할 것”
  • ▲ ⓒ카카오
    ▲ ⓒ카카오
    과학기술정보통신부가 카카오톡 서비스 장애가 잇따르면서 3개월 내로 시정할 것을 요구했다.

    과기정통부는 31일 통신재난관리심의위원회를 열고 카카오의 미흡사항에 대한 시정조치 요구사항을 심의·의결했다고 밝혔다.

    앞서 과기정통부는 21일과 23일 카카오톡 서비스 장애 원인과 대응, 복구 현황에 대한 카카오의 통신 재난 관리계획 이행 여부를 점검한 바 있다.

    과기정통부는 카카오에 1개월 내로 개선 조치계획을 수립해 제출하고, 3개월 이내에 시정 결과를 제출토록 할 계획이라고 전했다. 시정 요구사항에는 ▲작업 전 사전테스트 체계 강화 ▲작업관리 통제 강화 ▲통신재난 관련 매뉴얼과 지침 보완 ▲모니터링 시스템 고도화 ▲장애 원인 분석과 사후관리 체계화 ▲이용자 고지 개선 등 6가지 항목이 담겼다.

    카카오톡 서비스 장애는 13일과 20일, 21일 세 차례 발생했다. 과기정통부에 따르면 13일에는 카카오톡 서비스 운영 데이터센터의 서버 파일을 업데이트하던 중 기존 파일을 삭제하는 과정에서 오류가 발생했다.

    20일은 네트워크 부하 분산을 위한 내부 시스템 기능을 개선하던 중 문제가 발생했다. 카카오는 사전 테스트를 진행했으나, 테스트 환경이 실제 카카오톡 운영환경과 차이가 커 장애 가능성을 식별하지 못했다.

    과기정통부는 13일과 20일 각각 6분간 발생한 오류로 인해 이용자의 약 80%가 카카오톡 메시지 발신 지연과 실패로 불편을 겪은 것으로 파악했다.

    21일 오류는 20일에 발생한 서버 오류를 해결하지 않은 상태에서, 동일 데이터센터에 있는 다른 서버에 자바(Java) 프로그램 업데이트를 진행한 것이 원인으로 드러났다. 오전 출근 시간대 54분간 이용자의 약 8%가 PC용 카카오톡 로그인 실패와 모바일용 카카오톡 메시지 수신, 발신 지연 피해를 입었다.

    이종호 과기정통부 장관은 “디지털서비스 장애는 국민 일상의 불편을 넘어 사회·경제 전반에 지대한 영향을 끼치는 만큼 재발 방지를 위해 사업자의 관리체계를 면밀히 점검하겠다”며 “카카오는 재난·장애 관리를 위한 조직문화 개선, 안정적인 서비스 제공에 책임을 다할 필요가 있다”고 강조했다.

    카카오 측은 “작업관리와 감독이 미흡했다는 점검 결과를 겸허히 수용한다”며 ”앞으로 주요 작업에 대한 내부 관리, 감독 프로세스를 재정비하고 강화할 계획”이라고 전했다.