3일간이나 국가전산망 정지된 건 대형 재난의 전주곡 [김형중 쓴소리 곧은 소리]
  • 김형중 호서대 디지털금융경영학과 석좌교수 (sisa@sisajournal.com)
  • 승인 2023.11.24 13:00
  • 호수 1780
이 기사를 공유합니다

언젠가 더 큰 장애 올 수 있음을 예고
설령 피할 수 없더라도 정부가 이번처럼 대응해선 안 돼

‘서비스 거부(denial of service)’라는 게 있다. 원하는 서비스를 받지 못하면 서비스가 거부되는 거다. 자기가 맡겨둔 돈을 은행에서 출금하지 못하는 것, 사이트에 접근하려 했는데 로그인하지 못하는 것, 이런 게 다 서비스 거부다. 정부24 전산시스템에서 주민등록등본을 발급받을 수 없는 일이 벌어졌다. 잠시 그랬다면 그러려니 했을 거다. 그런데 11월17일부터 무려 3일간 행정전산망 장애가 발생했다. 국민의 불편이 컸다. 이번 장애로 전산망이 국민의 서비스 요구를 거부한 거다.

이런 걸 도스(DoS)라고 한다. 외부에서 전산시스템에 패킷을 엄청나게 보내 서비스가 되지 못하게 하면 이를 도스 또는 디도스(DDoS) 공격이라고 한다. 내부에서 시스템에 문제가 생겼을 때는 도스 장애라고 한다. 국민이 서비스를 받지 못한다는 관점에서 외부 공격이나 내부 한계는 둘 다 같다. 한국에서는 도스 공격에만 관심을 가졌다. 이 공격은 주로 북한 등 외부의 공격에 의한 것이었기 때문에 주목을 받았다. 이제는 내부 한계에 주목해야 할 때다.

아무튼 3일간이나 국가전산망이 정지된 건 흔치 않은 일이다. 이번 장애는 앞으로 더 큰 디지털 장애, 디지털 재난이 기다리고 있다는 걸 우리에게 알려주는 전주곡이다. 불행 중 다행인 건 이 정도의 피해로 마무리되었다는 점이다. 해킹에 의한 장애가 아니었다는 것에 감사해야 할 일이 아니다. 이번 장애 같은 게 자주 발생한다는 건 언젠가 더 큰 한 방이 올 수 있다는 걸 우리에게 예고하고 있다. 정부는 최대한 그런 장애를 막아야 하고, 설령 그 장애를 피할 수 없을 때라도 지금처럼 대응해서는 안 된다. 그래서 이번 사태에서 반드시 교훈을 얻어야 한다. 대형 사고가 발생하기 전에 수십 차례 경미한 사고와 수백 번의 징후가 발생한다는 하인리히의 법칙이 있다. 이 법칙을 무시하지 말아야 한다.

전국 지자체 공무원들이 사용하는 행정전산망 오류로 민원 업무 차질이 빚어지고 있는 11월17일 서울 종로구청 무인민원발급기에 오류코드가 보이고 있다. ⓒ뉴시스

장애 원인 아직 밝혀지지 않은 게 더 큰 문제

이 사태의 가장 비극적인 면은 아직 장애의 원인이 명확하게 밝혀지지 않았다는 점이다. 원인을 모르면 장애는 복구되었으나 복구되지 않은 것 같은 찜찜함이 남는다. 11월23일 조달청에 장애가 발생해 시스템이 1시간이나 또 멈췄다. 국민이 불안하게 생각하는 게 무리가 아니다. 행정안전부가 L4 스위치에 문제가 있었다고 발표했지만 전문가들은 그 말을 별로 믿지 않는다. 스위치 고장을 바로잡는 데 며칠이 걸렸다는 게 선뜻 납득되지 않기 때문이다. 언론에 이러저러한 대책이 등장하지만 원인을 모르는데 효과적인 대책이 되기 어렵다. 재난복구(DR) 서버가 없었고 스토리지가 서버를 대신했다는데 이게 장애의 원인은 아니지만 신속한 복구를 어렵게 했다.

한국은 세계 최고 수준의 전자정부를 구축했다. 그래서 한국인은 아무나 누리기 힘든 디지털 호사와 편리함을 만끽하고 있다. 어찌 보면 한국이니까 이런 서비스 거부 장애를 겪는 것이다. 한국은 1994년에 정보통신부를 만들었고 1996년 전자정부 프로젝트를 시작했다. 다른 나라보다 한국의 전자정부가 한참 앞섰기 때문에 외국에선 터지기 어려운 서비스 거부 장애가 이 나라에서 일어나고 있다. 서비스 거부 장애는 국민을 짜증 나게 한다. 그런데 그 서비스 거부 강도가 높아지면 국민이 큰 피해를 보게 된다. 그래서 이번 장애를 잘 해결하고 그 경험을 녹여내 전자정부를 한 단계 업그레이드해 그만큼 한국의 경쟁력을 높여야 한다. 이번 장애는 어느 정도 비극적이지만 멋진 연극으로 결말을 지어야 한다. 그 첫걸음이 장애의 원인을 정확히 파악하는 것이다. 그리고 디지털 재난을 체계화해야 한다.

우리에게 익숙한 자연재해에는 태풍 같은 기상재해와 지진 같은 지질재해가 있다. 그 재해에는 저마다 등급이 있다. 태풍의 강도는 5등급으로 나뉘며 지진은 진도나 리히터 규모로 측정된다. 다소 생소하겠지만 디지털 재해라는 것도 있다. 11월17일에 발생한 전산장애는 디지털 재해의 한 예다. 서류 발급이 이뤄지지 않아 계약 같은 게 성사되지 못한 피해가 다수 발생했다. 그 장애로 인해 사람이 죽거나 다치지 않았다고 대수롭지 않게 여겨서는 안 된다. 이번 장애는 진도 2.0 정도의 지진에 비교될 수 있다. 땅이 약간 흔들렸다고 그냥 넘길 일이 아니다. 이건 언젠가 진도 5.0 또는 6.0의 지진이 발생할 수 있음을 알려준다.

2021년 미국의 콜로니얼 파이프라인이 랜섬웨어 공격을 받아 5500마일의 송유관이 6일간 멈췄고 조 바이든 대통령이 비상사태를 선포한 바 있다. 이건 11월17일의 전산장애보다 훨씬 더 심각한 디지털 재해에 속한다. 디지털 변환이 심화될수록 인류는 더 심각한 디지털 재해에 노출될 수밖에 없다. 끔찍했던 콜로니얼 파이프라인 사태는 해커에게 75개의 비트코인을 넘겨주고 해결되었다. 해커들은 더 끔찍한 재앙을 초래할 수 있는 취약점을 노린다. 해커를 막는 것도 중요하지만 내부의 문제점을 파악하고 업그레이드하는 데도 소홀해서는 안 된다.

 

디지털 재해 체계화하고 피해 대책 세워야

대형 사고가 발생하기 전에 수십 차례 경미한 사고와 수백 번의 징후가 발생한다는 통계적 법칙이 있다. 그게 하인리히의 법칙이다. 2015년에도 세올 시스템에 장애가 발행해 2시간 후 복구된 바 있다. 금년에도 다른 시스템에서 여러 전산장애가 발생했다. 그런데 국민은 별로 경각심을 갖지 않았다. 그리고 다시 세올 시스템을 포함한 행정전산망에서 큰 장애가 발생했다. 해킹이 아닌데 복구에 3일 걸렸고 장애가 발생한 후 일주일이 지나서도 원인을 밝히지 못하고 있다는 게 아쉽다.

차제에 우리는 디지털 재해에 대비해야 한다. 우선 디지털 재해의 정도를 규정하고 피해 대책을 세워야 한다. 태풍처럼 ‘약’ ‘중’ ‘강’ ‘매우 강’ ‘초강력’으로 구분할 수 있을 게다. 2015년에 발생한 세올 시스템 장애가 ‘약’이라면 이번 복합장애는 ‘중’으로 보는 게 맞을 거다. 만사 유비무환이라 했다. 장차 ‘강’ 또는 ‘매우 강’처럼 더 심각한 디지털 장애가 발생해도 그에 맞는 대응법을 미리 마련해 두어 정부와 국민이 우왕좌왕하지 않게 해야 한다.

이번 장애에서 아쉬운 점이 하나 있다. 장애가 발생하기 하루 전에 세올 시스템, 네트워크, 인증 서버의 업데이트가 동시에 이루어졌다는 게 그것이다. 셋을 동시에 업데이트하고도 아무 문제가 없었다면 그냥 그렇게 지나갔을 것이다. 그런데 비용과 시간이 더 들더라도 시스템을 하나씩 순차적으로 업그레이드하는 게 원칙이었다. 그래야 장애가 발생해도 단순장애에 그친다. 그런데 세 시스템을 함께 고치는 바람에 복합장애가 발생한 거다. 복합장애가 발생하면 장애의 원인을 파악하기 어렵다. 그런데다 문제의 행정전산망에 장애복구 서버도 없었다고 한다.

국민이 더 큰 서비스 거부를 당하지 않도록 정부는 이 사태를 엄중히 살펴보아야 한다.

※ 외부 필진의 칼럼은 본지의 편집 방향과 다를 수 있습니다.

김형중 호서대 디지털금융경영학과 석좌교수
김형중 호서대 디지털금융경영학과 석좌교수

 

관련기사
이 기사에 댓글쓰기펼치기