
[ 김덕엽 칼럼니스트 ] 정부 전산망 대란이 발생한 지 시간이 흘렀지만, 현실은 냉정하다. 중앙대책본부에 따르면 시스템 복구율은 여전히 30%대 중반에 머물고 있고, 핵심 1등급 일부를 포함한 다수 서비스가 분진 오염과 장비 분해·세척·재조립 절차 때문에 지연되고 있다. “복구 중”이라는 말이 길어질수록 국민의 시간 손실은 눈덩이처럼 불어난다.
이번 사태의 두 번째 진실은 상실 그 자체다. 대전 데이터센터 화재로 파괴된 시스템 가운데, 95개는 백업이 있었지만 유독 ‘G-드라이브’만은 백업이 없었다. 결과적으로 최대 858TB, 직원 17%가 쓰던 8년 치 내부 문서가 사실상 영구 소실됐다는 추정이 이어진다. “용량이 커서 백업이 어려웠다”는 해명은 2025년의 행정 IT가 내놓기엔 너무 낡은 언어다. 클라우드는 ‘무한 저장고’가 아니라, 표준화된 중복과 테스트가 있을 때만 신뢰가 된다.
세 번째 문제는 거버넌스의 왜곡이다. 정부는 등급(1~4등급) 기준에 따라 핵심부터 복구 중이라고 밝혔지만, 사고 이후 일부 시스템의 중요도 등급이 뒤늦게 낮춰졌다는 보도가 나왔다. 위기 때 등급이 바뀐다면 등급 체계는 국민에게 “무엇을 먼저 살려야 하는가”를 안내하는 나침반이 될 수 없다. 우선순위가 전략이 아니라 사후적 명분이 되어선 안 된다.
네 번째로, 복구 속도와 투명성의 간극이다. 정부는 ‘완전 복구까지 한 달’을 전망했지만, 실제 복구 현황은 날짜가 갈수록 들쑥날쑥했다. 핵심 1등급 40개 중 30개가 정상화됐다는 수치는 위안이지만, 국민이 체감하는 불편은 여전히 크다. 숫자는 현장을 위로하지 못한다. 필요한 것은 일관된 기준과 예측 가능한 브리핑이다.
이 사태의 교훈은 분명하다. 첫째, 제도는 사건보다 앞서 있어야 한다. 법정 RTO·RPO를 등급별로 공개하고, 위반 시 기관과 책임자에 대한 재정·평가 페널티를 자동 발동하는 ‘선(先)계약·후(後)집행’ 체계를 만들어야 한다. “최대한 신속히”라는 수사는 더 이상 해답이 아니다.
둘째, 백업은 기술이 아니라 문화다. 3-2-1 원칙(사본 3개·매체 2종·오프사이트 1개)을 공공 표준으로 의무화하고, 분기마다 실제 복구 리허설을 실시해 결과를 공개해야 한다. ‘G-드라이브’의 공백은 기술 부족이 아니라 절차와 훈련의 부재가 만든 인재였다.
셋째, 인프라는 ‘분리’가 기본이다. 배터리/UPS/서버의 물리적 분리, 방화구획 재시공, 불활성가스 소화와 항온·항습 이중화, 그리고 최소 2개 리전에 걸친 액티브–액티브 분산과 자동 페일오버를 공공센터 표준으로 못 박아야 한다. “유지보수 중 스파크”가 국가 전체를 멈추게 해서는 안된다.
넷째, 투명성은 기술과 같은 급이다. 모든 공공 디지털 서비스의 가용성 SLO, 월간 가동률, 장애 이력과 사후분석을 한 화면에서 공개하는 ‘공공 디지털 대시보드’를 상시 운영해야 한다. 국민은 “몇 퍼센트 복구”보다 “내 업무는 오늘 어디서, 어떻게 처리되는가”를 알고 싶어 한다.
마지막으로, 잘못은 사람에게 묻고 신뢰는 시스템으로 회복해야 한다. 경찰은 부속 전원 차단 등 안전 수칙 위반 여부를 수사 중이고, 관련자 다수가 입건됐다. 이 책임의 사슬을 끝까지 확인하되, 동시에 인사 문책만으로 끝내지 말고 계약·훈련·표준까지 함께 갈아엎어야 한다. 신뢰는 말이 아니라 구조에서 나온다.
불은 껐다. 그러나 신뢰는 아직 타고 있다. 복구율 35%의 오늘이 부끄럽지 않으려면, 858TB가 사라진 어제를 인정하고, 등급과 우선순위를 사실로만 설명하며, 백업과 분산을 문화로 만들고, 투명성을 제도로 박아야 한다. 국가가 국민에게 줄 수 있는 가장 큰 예측 가능성은 “다음에는 멈추지 않는다”는 약속이다. 이제 그 약속을 수치와 계약으로 증명할 차례다.
* 외부 필진 기고는 더타임즈 본지 편집 방향과 다를 수 있습니다.