“KT 통신 장애, 관리부실 속 명령어 누락이 원인”
  • 박세진 디지털팀 기자 (ordinary_psj@naver.com)
  • 승인 2021.10.29 17:08
이 기사를 공유합니다

과학기술정보통신부 29일 사고 원인 조사 결과 등 발표
라우팅 작업 중 명령어 ‘exit’ 누락…사전·사후 대책 無
지난 25일 오전 한때 KT의 '설정 오류에 따른 장애'로 유·무선 인터넷 서비스가 중단됐다. 사진은 이날 오후 서울 종로구 KT 광화문 사옥 모습 ⓒ연합뉴스
지난 25일 오전 한때 KT의 '설정 오류에 따른 장애'로 유·무선 인터넷 서비스가 중단됐다. 사진은 이날 오후 서울 종로구 KT 광화문 사옥 모습 ⓒ연합뉴스

KT 인터넷 통신망 장애는 KT부산국사에서 기업망 라우터 교체 작업 중 발생한 명령어 입력 오류가 원인으로 확인됐다. KT는 이 같은 문제에 대한 관리적·기술적 대책도 제대로 마련하지 않았던 것으로 드러났다.
 
과학기술정보통신부는 KT 네트워크 장애 사고의 원인을 조사·분석한 결과와 향후 대책 마련 계획 등을 29일 발표했다. KT 네트워크 장애사고는 지난 25일 오전 11시16분쯤부터 낮 12시45분까지 약 89분간 발생했다.

과기정통부에 따르면, 이번 사고의 원인은 'KT의 관리부실'로 드러났다. 먼저 KT 네트워크관제센터가 새벽 1시~6시 사이 야간작업을 승인했지만 실제 작업은 주간에 이뤄진 것으로 파악됐다. 또 관리자 없이 KT 협력업체 직원들끼리 라우팅 작업을 진행하기도 했다. 더군다나 네트워크가 연결된 채로 작업을 진행하면서 오류 방지를 위한 작업 관리체계도 허술했다.

이런 상황 속 부산 국사에서 라우터 교체 작업을 진행하던 중, 작업자가 사고발생 라우터에 라우팅 설정명령어를 입력하는 과정에서 'exit' 명령어를 누락하면서 사고가 났다. 하지만 스크립트 작성과 두 차례에 걸친 사전 검증 과정에서 이를 파악하지 못했다.

네트워크가 차단된 가상 상태에서 오류 여부를 사전에 발견하기 위한 가상 테스트베드도 없었다. 또 지역에서 발생한 오류가 전국적으로 확산하는 것을 차단할 수 있는 시스템도 부재했던 것으로 파악됐다.

재발 방지를 위해 과기정통부는 주요통신사업자 네트워크의 생존성·기술적·구조적인 대책이 담긴 '네트워크 안정성 확보방안'을 마련할 계획이다. 과기정통부 네트워크정책실장을 단장으로 관계 전문가들과 태스크포스(TF)를 만들 계획이다.

단기 대책으로는 Δ주요 통신사업자의 네트워크 작업체계 점검 Δ네트워크 작업으로 인한 오류여부를 사전에 진단할 수 있는 시뮬레이션 시스템 도입 Δ네트워크관제센터에서 기술적 점검 체계를 구축 Δ라우팅 작업 시 한 번에 업데이트 되는 경로정보 개수를 일정 수준 이하로 제한하는 방안 등이 검토될 예정이다.

중장기 대책으로는 Δ주요통신사업자의 통신장애 대응 모니터링 체계 강화 Δ네트워크 안정성과 복원력을 높이는 기술개발 Δ안정적인 망 구조 등 네트워크의 생존성 확보를 위한 구조적 대책 마련 등이 추진된다.

KT는 이번 일로 피해를 입은 이용자를 파악해 피해구제 방안을 마련할 방침이다. 이후 방송통신위원회가 이용자 피해구제 방안 이행 여부를 점검하고 통신장애 발생 시 실효성 있는 피해구제를 위한 법령 및 이용약관 등을 검토할 계획이다.

관련기사
이 기사에 댓글쓰기펼치기