재발방지·피해보상안 발표 날, 협력사 구상권 청구 언급
"KT는 협력사 잘못 검증 못 한 2차적 책임" 주장
10기가 인터넷 속도 저하 논란 때도 협력사에 책임 전가
특히 협력사에 구상권 청구 가능성까지 거론하며 고객들에게 지급해야 할 피해 보상액 책임의 일부를 떠넘기려는 것 아니냐는 눈총을 받고 있다.
KT는 1일 KT광화문사옥에서 기자회견을 열고 '유·무선 인터넷 서비스 장애 재발 방지 대책'을 마련해 조속히 적용하겠다고 밝혔다.
서창석 KT 네트워크혁신TF장(전무)은 "이번에 KT가 기업 고객에게 보다 좋은 서비스를 제공하기 위해 신규 장비를 배치하는 작업을 진행했다. 기존 장비의 재배치 작업은 KT가 직접 다 한다. 하지만 신규장비의 경우, 협력업체와 같이 해야만 한다"며 "KT가 작업관리를 더 철저히 해서 다시는 이런 사고가 발생하지 않도록 하겠다"고 말했다.
KT 주장에 따르면 그동안 KT는 연간 4000여건의 야간 라우팅 작업을 수행하면서 KT연구개발센터의 테스트베드를 활용해 현장에서 발생할 수 있는 문제를 사전 점검해왔다. 이와 함께 라우팅 변경 작업이 많은 센터망과 중계망 및 일부 엣지망의 경우 오류가 발생했을 때 전국적인 장애로 이어지지 않도록 정보전달 개수를 제한하고 있다. 또한 연간 4만여건에 이르는 네트워크 작업은 계획부터 관리·승인, 실행·검증까지 단계별 절차로 진행된다.
그러나 실제 현장에선 이 같은 절차가 제대로 지켜지지 않았고, 지난달 25일 오전 11시20분부터 약 89분간 전국에 통신망 장애 사태를 일으켰다.
KT는 이번 사태의 원인으로 ①야간에 진행해야 할 작업을 주간에 KT 직원이 없는 상황에서 이뤄진 점 ②사전 검증단계에서 협력사 오류로 인한 명령어 누락을 파악하지 못한 점 ③잘못된 라우팅(네트워크 경로설정) 정보가 엣지망을 통해 전국으로 확산된 점을 들었다.
그러면서 이번 사태의 근본적인 책임이 관리자의 부재와 협력업체이 있음을 역설하기 위해 노력했다.
서 전무는 "KT는 연간 4000여건의 라우팅 및 업데이트 작업을 수행한다. 표준작업절차서와 비교하는 간단한 일이다. 저희가 지금까지 10년 넘게 일하면서 처음 생긴 문제였다"며 "신규 네트워크 적용 작업 작업을 할 때는 협력사가 표준작업절차서를 수정해서 가져오는 것으로 계약서에 돼 있다. 1차적 잘못은 협력사에 있다"고 강조했다.
이어 "2차 잘못은 KT에 있다. (협력사의) 잘못을 검증해야 하는데 잘못한 것"이라면서도 "협력사의 구상권 청구 문제는 저희가 조금 더 사안을 조사해 파악한 뒤 결정하겠다"고 덧붙였다.
이와 유사한 KT의 대처는 이전에도 있었다. KT는 지난 4월 10기가 인터넷 서비스 속도 제한 논란에 휩싸였을 당시에도 책임을 하청업체에 전가했다. 재발방지 및 사과문을 발표한 같은날 KT는 협력업체에 "10기가 관련 이슈가 도급비에도 영향을 미치게 돼 소급 차감하겠다"는 내용의 긴급 공지 문자를 보낸 것으로 알려져 비판 받았다.
이번에 KT가 시사한 구상권 청구 문제는 중소벤처기업·스타트업 종사자들이 우려하던 일이었다. 한 벤처기업 관계자는 "국가기간통신망 사업자인 KT가 이번 사태의 책임을 협력업체 탓으로 돌리지 않길 바랬다. 협력업체의 실수도 분명 있었지만, KT의 해명은 아쉬울 따름"이라며 "KT의 구상권 청구로 하나의 회사가 또 문을 닫게 되는 것 아닌지 우려스럽다"고 말했다.
한편 KT는 이번 사고를 교훈 삼아 기술적 측면과 관리적 측면에서 재발방지 대책을 마련해 강력히 시행하겠다고 약속했다.
기술적 측면에서는 기존 시뮬레이션 시스템을 확대(가상화 테스트베드)해 사람의 실수로 인한 장애를 완벽히 차단하겠다고 강조했다. 이전까지 작업 준비 단계에서만 적용했던 테스트베드를 가상화해 전국 각 지역에서 새로운 라우팅을 적용하기 직전 최종적으로 테스트한 이후 실제 망에 적용하는 것을 추진한다. KT는 이를 통해 실제 망에 적용하기 전 발생할 수 있는 문제를 사전 파악할 수 있다고 설명했다.
또한 현재 모든 센터망과 중계망 및 일부 엣지망에 적용 중인 라우팅 오류 확산방지 기능(정보전달 개수 제한)을 모든 엣지망으로 확대할 계획이다. 이를 통해 엣지망에서 발생한 라우팅 오류가 전국망에 영향을 미치는 것을 사전 차단할 수 있다는 설명이다.
이와 함께 유선과 무선 인터넷 장애가 동시에 발생하지 않도록 다양한 형태의 백업망을 구성하는 방안을 마련할 예정이다.
작업관리와 관련해서는 기본 절차를 철저히 준수(Back to the Basic)하는 한편 이중, 삼중의 '현장 작업 자동통제 시스템'을 도입해 체계적인 재발방지에 나서겠다고 밝혔다. 이번 인터넷 장애는 기본을 준수하지 않은 작업이 원인이었던 만큼 KT는 단계별로 오류가 발생할 가능성에 대해 원점부터 세밀히 검토하고 있다.
원칙에서 벗어난 작업을 원천적으로 방지하는 데 핵심 열쇠가 될 현장 작업 자동통제 시스템은 3단계로 구성된다. 1단계는 작업자가 주요 명령어를 입력할 때 OTP(일회용 패스워드)로 관리자가 승인하도록 해 관리책임을 강화한다. 2단계는 네트워크 관제센터에서 미승인 작업 여부를 실시간 자동으로 모니터링해 위험요소를 차단한다. 3단계는 관제센터에서 KT 직원의 작업 참여를 인증한 후에야 실제 작업이 가능하도록 하는 등 단계별 검증 프로세스를 구축할 계획이다.
구현모 KT 대표는 “KT를 믿어주신 여러분들께 불편을 드려 다시 한번 진심으로 사과의 말씀을 드린다”며 “신속히 재발방지대책을 적용해 앞으로 신뢰 회복에 최선을 다할 것”이라고 밝혔다.
◎공감언론 뉴시스 odong85@newsis.com