광주 DC 포함 엔비디아 H100 GPU 1000대 확보전력·열 관리 최적화… 인프라 운영 노하우 결집AI 생태계 활성화 앞장, ‘풀스택 AI CSP’ 목표
  • ▲ ⓒNHN클라우드
    ▲ ⓒNHN클라우드
    NHN클라우드가 과학기술정보통신부, 광주광역시와 함께 조성한 국가 AI 데이터센터는 평범한 IDC(인터넷데이터센터)가 아니었다. 초고사양 AI 인프라를 충족하는 대규모 GPU 역량이 밀집돼 CSP(클라우드 서비스 제공사)로서 한 단계 업그레이드된 면모를 보여줬다.

    AI 데이터센터는 국가 보안시설인 만큼 들어가는 절차부터 까다로웠다. 보안 서약서를 작성하고, 촬영을 막기 위해 휴대전화 카메라와 포트 연결부분까지 스티커가 붙었다. 내부 청결 상태를 유지하기 위한 덧신도 신고 나서야 출입할 수 있었다.

    곧바로 데이터센터의 심장인 서버가 위치한 전산실로 향했다. 마치 실내 식물원을 들어가는 듯한 느낌이 들었다. 느껴지는 온도와 습도, 바람까지 외부와는 완전히 단절된 분위기를 연출했다.

    팬이 돌아가면서 내는 날카로운 소음은 들어갈 때 이어플러그를 전달해 준 이유를 알게 했다. 특히 랙과 랙 사이를 지나갈 때 열기와 거센 바람은 압권이었다. 정적인 줄 알았던 데이터센터 서버가 위치한 공간은 생각보다 역동적이었다.

    이는 AI 인프라를 구성하는 GPU 서버의 안정성을 확보하기 위함이다. 엔비디아 H100 등 국가 AI 데이터센터에 구축한 GPU 장비는 구동을 위해 고전력이 필요할뿐더러, 그만큼 발열도 심하다.
  • ▲ ⓒNHN클라우드
    ▲ ⓒNHN클라우드
    NHN클라우드는 생성형 AI 수요에 대응하기 위한 초고성능 GPU 인프라 안정적 운영에 많은 공을 들였다. 그중 핵심은 전력공급으로, 랙당 전력밀도 15kW는 국내 데이터센터의 평균 전력 밀도 4.8kW의 3배 수준이다. 15kW는 에어컨 9대, TV 98대가 동시에 가동할 수 있는 전력량이다.

    GPU 서버를 기반으로 센터를 설립하는 과정도 일반적인 데이터센터 설계와는 다르게 진행됐다. 차폐환경을 구축해 냉방에 사용되는 에너지를 감축하고, 차가운 공기와 뜨거운 공기가 섞이지 않아 고효율 냉방이 가능하다.

    기존 서버룸과 같이 공기가 밑에서 나와 식히는 방식이 아닌 좌우에서 바람을 내보내는 방식으로, 최대 풍량은 88만CMH에 달한다. 이는 가정용 선풍기 292대가 동시에 가동하는 것과 맞먹는다. 뜨거운 공기는 위쪽으로 향하며, 7.8m에 달하는 층고로 더운 공기를 가두고 다시 순환하면서 냉각된 바람이 서버를 식힌다.

    전산실 옆에 위치한 항온·항습기실은 항상 같은 온도와 습도를 유지하기 위한 공간이다. 배수관을 통해 차가운 물이 투입되고, 뜨거워지면 나가는 순환을 옥상까지 연결해 재활용하는 장치를 마련했다. 자원을 효율적으로 활용하면서도 최적화하기 위한 고민이 엿보이는 부분이다.

    전력 효율성만큼이나 끊임없이 서비스를 제공하기 위한 안정성도 높은 수준을 갖췄다. 데이터센터 주요 인프라 구성을 심사하는 기준으로 Tier 3등급에 4등급 요건이 일부 더해졌다. 3등급 이상이면 일반적으로 안정적인 IDC로서 인정받으며, 4등급은 운영장비와 시스템이 모두 이중화돼있는 시설을 의미한다.
  • ▲ ⓒNHN클라우드
    ▲ ⓒNHN클라우드
    전력공급 중단 상황에서 발전기는 10초 이내 작동해 건물과 서버 전체에 전력을 공급한다. 국가 AI 데이터센터에 구축된 발전기는 총 4대로, 한 대당 발전 용량은 2000kW 정도다. 건물 전체에 필요한 용량이 6000kW인걸 감안하면, N+1로 비상 전력을 구축한 셈이다.

    NHN클라우드 관계자는 “발전기를 가동하면 27시간 전원공급이 가능하다”며 “가동까지 단절된 10초 동안은 UPS와 배터리가 백업한다”고 설명했다. 27시간 이후에도 전력공급이 중단되면 인근 주유소를 통해 급유받게 되며, 비상상황을 대비한 우선 공급 협약도 체결돼있다고 덧붙였다.

    공기 온도를 낮추기 위한 냉동기 설비도 N+1로 구축됐다. 영상 5도 이하로 랙 온도가 내려가면 냉동기 작동을 중단해 에너지 절감에도 신경썼다. 전산실 항온 항습에 사용된 물이 관을 통해 냉동기까지 이어지는 순환식 사용도 확인할 수 있었다.

    데이터센터 화재 방지와 대응을 위한 기술적 준비와 매뉴얼도 충실히 준비했다. 윤용수 데이터센터엔지니어링실 기술리더(이사)는 “배터리실은 물론 모든 공간을 CCTV로 확인하고, 온도와 연기 실시간 감지를 수행하고 있다”며 “화재발생 시를 대비해 소방서와 직통전화 핫라인을 구성했고, 올봄에 화재훈련도 예정돼있다”고 전했다. 내진설계도 리히터 규모 7.0을 대응한다.

    NHN클라우드는 그동안 공공영역과 금융, 민간 버티컬 서비스를 중심으로 클라우드 비즈니스를 확장해왔다. 공공부문에서 클라우드 네이티브 전환사업 6개 과제 중 4개를 수행하고, 핵망과 연결된 유일한 클라우드로서 입지를 다지고 있다. 금융 부문에서는 IDC 내 별도 랜딩존을 구축하고, 오픈스택의 장점을 극대화하며 하이브리드 클라우드 구축을 돕고 있다.