네이버 데이터센터 '각 세종' 가보니…전력·냉각·서버 완전 분리한 이중화 구조
무정전 설계로 장애 전파 차단, 화재 발생 시 자체 진압 가능
로봇으로 단순 반복 작업 최소화…연말부터 각 세종 2·3차 착공
섭씨 22~26도가 일정하게 유지되는 서버실에서는 수만대의 장비가 쉼 없이 연산을 수행하고 있었다. 일부 서버실에는 로봇이 드나든다. 인공지능(AI) '두뇌'라 불리는 네이버 데이터센터 '각 세종'은 2023년 11월 가동 이후 단 한 차례 정전이나 장애 없이 24시간 멈추지 않고 돌아가고 있다.
◆국립중앙도서관 데이터 100만배 저장 가능한 네이버 AI 핵심 거점
27일 기자가 찾은 '각 세종'은 축구장 41개 크기인 29만4000㎡(약 8만9000평) 대지 위에 지어졌다. 추후 서버동을 모두 구축하면 서버를 60만 유닛(서버 단위 규격)까지 수용할 수 있다. 국립중앙도서관이 현재 보관 중인 데이터의 약 100만배에 달하는 65엑사바이트(EB) 용량의 데이터를 저장할 수 있다.
AI 데이터센터인 '각 세종'은 AI 학습·추론·배포가 한 공간에서 유기적으로 연결되는 통합 인프라로 네이버의 모든 AI 서비스 기반이 되는 핵심 거점이다.
그만큼 출입 절차는 어느 보안시설 못지 않다. 본관 입구에서는 스마트폰, 노트북 등 모든 전자기기 카메라에 스티커가 부착되고 신원과 방문 목적이 일일이 확인된다. 기자단 방문도 철저한 통제 속에서 진행됐다. AI 두뇌가 들어 있는 만큼 정보 유출에 대한 대비가 완벽히 이뤄져 있었다.
서버실로 들어가려면 지문 인식 등 다단계 인증을 거쳐야 하며 한 통로의 문이 완전히 닫히기 전 다음 구간으로 이동할 수 없다. 네이버 측은 엑스레이, 볼라드, 지문인식, 스피드게이트 등 다단계 보안 절차가 적용해 물리적·전자적 이중 방호 체계를 구축했다고 설명했다.
◆"어떤 상황에도 멈추지 않게"…전력·냉각·서버 완전 분리
네이버가 각 세종을 소개하면서 돋보인 운영 철학은 '어떤 상황에서도 작동이 멈추지 않는 데이터센터'다. 최근 국가정보자원관리원(국정자원) 화재로 데이터센터 등 전산 시설 재난 대응 중요성이 부각된 가운데 각 세종은 전력·냉각·서버 운용 체계를 완전히 분리한 이중화 구조를 채택했다.
메인 전력 공급 선로는 철근 콘크리트 구조물로 보호되고 주·예비 선로는 이원화돼 있다. 하나의 계통이 사고를 당해도 다른 계통이 즉시 기능을 이어받는다.
서버실의 전체 층고는 약 7m지만 이 중 4.5m를 기점으로 물리적으로 천장을 구분해 모든 케이블을 상부 트레이로 올려 바닥·전면부 공기 흐름을 방해하지 않도록 했다. 냉기가 원활하게 순환될 수 있도록 층고를 높이고 케이블을 천장으로 정리해 냉각 효율과 장비 접근성을 동시에 확보했다.
전력 장애가 발생하면 층별 무정전 전원 장치(UPS)가 0.001초 이내에 대체 전원을 공급했다. 스태틱 UPS로 불리는 이 시스템은 모듈 단위로 증설과 이전이 가능해 빠르게 변하는 IT 환경에서도 유연하게 대응할 수 있다.
또 서버 랙 단위까지 원자력 발전소 수준 내진 기준을 충족해 진도 9 규모의 지진에도 버틸 수 있다. 산불 대비용 방수총·열화상 카메라·스프링클러를 곳곳에 설치해 화재 발생 시 자체 진압이 가능하다. 화재 발생 시 서버실을 보호하기 위해 소화가스실도 별도로 조성했다.
◆GPU 고열 잡는 네이버 신기술…기후 따라 자동 전환
AI 데이터센터의 가장 큰 기술 과제는 냉각 효율이다. 그래픽처리장치(GPU) 서버는 기존 중앙처리장치(CPU)보다 전력과 열이 3배 이상 많다. 네이버는 이를 해결하기 위해 '각 춘천'에서 검증한 친환경 냉각 기술을 고도화해 '나무-Ⅲ' 모델을 적용했다.
이 시스템은 외부 공기를 직접 이용하는 직접 외기와 외부 공기를 냉수와 함께 사용하는 간접 외기를 기후에 따라 자동 전환한다. 봄·가을에는 자연 외기로 냉각하고 여름철 고온·고습이나 미세먼지 시에는 간접외기 모드로 전환된다.
건물은 북서풍을 극대화하기 위해 부채꼴 형태로 배치돼 있으며 복층 구조 서버실을 통해 뜨거운 공기가 빠르게 배출된다. 이를 통해 연간 약 73%의 에너지 절감 효과를 거두고 있다.
폐열은 난방과 눈 녹임에 재활용되고 빗물은 정화 후 냉각탑 보급수나 조경용수로 다시 쓰인다. 이러한 친환경 설계 덕분에 각 세종은 지난해 글로벌 친환경 인증 'LEED' 플래티넘 등급을 획득했다.
◆관제센터·로봇·자율주행이 한몸처럼
통합관제센터는 데이터센터 '눈'을 맡는다. 이곳에서는 수만 개 센서의 실시간 데이터를 바탕으로 온도·전력·습도를 상시 감시한다. 대형 스크린에는 ▲폐쇄회로(CC)TV 등 시설 영상 ▲주요 설비 상태 확인을 위한 퍼실리티 모니터링(FM) ▲실시간 뉴스·이슈 모니터링 화면이 동시에 뜬다.
뉴스·이슈 모니터링 공간을 별도로 설치한 이유는 외부 이슈로 포털 트래픽이 급증할 수 있기 때문이다. 이때 트래픽이 자동으로 서버 부하가 분산되도록 연동돼 있다.
로봇은 '각 세종'의 또 다른 손과 발이다. 네이버는 사옥 '1784'에서 엘리베이터·문·보안 게이트까지 로봇 동선을 통합한 자율주행 운영을 축적했고 이 경험을 데이터센터에도 이식했다.
자산 자동화 로봇 '세로'는 서버 자산을 인식해 2㎜ 오차로 불출·적재한다. '가로'는 서버실과 로봇 창고를 오가며 최대 400㎏ 장비를 운반한다. 기본은 완전 자율주행이지만 필요 시 작업자가 핸들을 잡고 미세 제어할 수 있다. 이날 참관 과정에서도 세로가 랙 위치 코드를 스캔해 서버 자산번호를 확인하고 가로가 고중량 장비를 무인으로 이송하는 모습을 확인할 수 있었다.
◆'각 세종' 2·3차 확장 착수 임박…"국내 최대 AI 인프라로 도약"
네이버는 이렇게 내부에 축적한 기술과 운영 역량을 기반으로 '서비스형 GPU(GPUaaS)' 모델을 통해 국내 주요 기업에 AI 인프라 서비스를 제공하고 있으며 이미 여러 산업 현장에서 활용되고 있다.
네이버는 2027년, 2029년 각각 각 세종 2차, 3차 센터 완공을 목표로 설정했다. 빠르면 연말 늦어도 내년부터 착공에 들어간다. 완공 시 전체 전력용량은 135㎿에 달한다.
GPU 밀도가 높아지는 만큼 2차 센터부터는 수냉식 서버 냉각(DLC)도 순차 도입할 예정이다. AI 고열 환경에서도 안정적으로 작동하는 인프라를 만들기 위함이다.
이상준 네이버클라우드 최고정보책임자(CIO)는 "AI 인프라의 경쟁력은 GPU 확보보다 얼마나 효율적으로 운영하느냐에 달려 있다”며 “각 세종은 그 운영 구조를 국내에서 처음 실현한 사례”라고 말했다.
이어 "축적한 AI 인프라 운영 역량을 GPUaaS 모델로 발전시켜 국내 기업들이 손쉽게 AI를 활용할 수 있는 생태계를 만들겠다"며 "AI 인프라가 특정 기업의 자산을 넘어 산업 전반의 성장 기반이 될 수 있도록 하겠다"고 밝혔다.
◆"GPU 늘어도 인력은 부족…AI 인프라 '보릿고개', 내년 중 온다"
한편 간담회 현장에서는 화려한 기술 성과 뒤에 놓인 현실적인 어려움도 언급됐다. 노상민 네이버클라우드 데이터센터장은 "GPU 수요가 급증하면서 전력 인프라나 입지 조건, 인력 확보가 동시에 중요해지고 있다. 이 세 가지 요소가 단기간에 해결되기 어려워 산업 전반이 조정기를 거칠 것"이라고 말했다.
이 CIO도 "GPU 확보 경쟁이 치열하지만 장기적으로는 운영 효율과 전문 인력 확보가 더 중요하다"며 "AI 데이터센터는 설비·운영·AI 기술이 융합돼야 하기 때문에 고도화된 전문성을 가진 인력이 필요하다"고 강조했다.
◎공감언론 뉴시스 alpaca@newsis.com