화재 발생 리튬 배터리 원인, 서버 케이블 영향개발자 작업 운영 도구 이중화 미흡, 복구 지연자체 데이터센터 화재·자연재해 대비 철저
  • ▲ ⓒ카카오
    ▲ ⓒ카카오
    홍은택 카카오 대표가 새로 짓는 전용 데이터센터는 화재 사건의 교훈을 바탕으로 설계에 반영하겠다고 강조했다.

    홍 대표는 19일 기자간담회를 열고 데이터센터 화재 발생과 복구 지연 원인을 설명하고 재발방지 대책을 밝혔다.

    데이터센터 화재 발생에 대해서는 리튬 배터리를 원인으로 지목했다. 리튬 배터리는 전력 공급이 끊기더라도 15분 간 전력 공급을 안정화하기 위한 장치다. 그는 “지하 3층 리튬 배터리에서 화재가 발생하면서 UPS(비상 전원공급장치)도 같이 탄 것 같다”며 “천장에 화재가 번졌는데 카카오 서버와 연결되는 전선 케이블이 영향을 받아 서버 전원이 내려갔다”고 설명했다.

    DR(Disaster Recovery, 재해복구) 시스템은 구축했지만 제대로 작동하지 않은 이유에 대해서도 답변했다. 홍 대표는 “서비스 주요 데이터와 응용프로그램에 대해서는 메인 서버가 위치한 판교 데이터센터 외 이중화 조치가 돼있지만, 개발자 작업 운영 도구가 이중화 되지 않았다”며 “서버 수가 많아 자동으로 서버를 배포하는 서버 자동화 시스템이 작동하지 않은 것으로 파악하고 있다”고 진단했다.

    카카오는 새로운 데이터센터 설립 전까지 판교 데이터센터를 복구하고, 추가 데이터센터를 확보할 방침이다. 4곳 데이터센터의 이중화 작업도 병행한다고 밝혔다.

    4600억원을 투입해 건설 중인 자체 데이터센터에 대해서도 부연했다. 새로운 데이터센터는 이번 화재 사고를 교훈삼아 해일, 지진 등 자연재해로부터 안전한 시설을 구축할 방침이다. 홍 대표는 건설 중인 데이터센터를 설명하기 위한 PT 자료도 준비했다.

    데이터센터는 설계와 건설, 가동과 개통까지 시간이 오래 걸린다는 전언이다. 그는 “제1데이터센터는 한양대 에리카 캠퍼스 내 위치해 지하 1층에서 지상 6층 규모로 구축하고 있다”며 “11만대 수준 서버를 수용해 늘어나는 수요에 대비할 계획이며, 2023년 9월에 완공해 2024년 1월 개통할 방침”이라고 말했다. 서울대 시흥 캠퍼스 내 위치한 제2데이터센터도 비슷한 수준의 서버 규모로 2027년 완공할 계획이다.

    새로 건설하는 데이터센터 방재계획에 따르면 안정적인 서버 운영을 위한 전력량을 확보하고, 비상 상황에도 전력 공급 가능한 백업전력계획을 수립했다. 서비스 연속성을 위한 통신·전력·화재 등 비상시 전력공급이 가능한 백업계획도 마련했다. 화재 발생으로 소방서가 출동하더라도 전력공급 중단을 최소화 하기위한 협의도 지속할 계획이다.

    지진·해일·강풍 등 자연재해에 대비한 대책도 이미 설계에 반영했다는 설명이다. 제1센터와 제2센터를 전용회선으로 연결해서 쉽게 백업하고 외부요인에 영향받지 않도록 했다.

    홍 대표는 “데이터 센터의 3면 공간이 부족해 공간을 마련을 위해 노력중이며, 자체적으로 자립하는게 중요하다고 생각해 준비 중”이라며 “화재 사건을 계기로 예방을 위해 배터리와 UPS가 한 공간에 있지 않도록 격벽을 설치하겠다”고 강조했다. 근본적인 문제는 화재 원인인 리튬 배터리기 때문에, 공간을 더 많이 차지하더라도 납축전지를 사용하는 방안을 검토하고 있다고 덧붙였다.