“빅데이터는 선거 전에 통합당 참패 이미 알고 있었다” 
  • 김택환 경기대 빅데이터센터 특임교수 (realsong@sisajournal.com)
  • 승인 2020.04.28 10:00
  • 호수 1593
이 기사를 공유합니다

[빅데이터로 본 총선]  서울 종로·광진을 등 격전지 5곳 분석…부정적 연관어, 선거 전까지 통합당이 더 많아

‘더불어민주당 압승, 미래통합당 참패, 중도 제3지대 소멸’.

이번 총선에 나타난 민심이자 각 당의 성적표다. 1987년 민주화 이후 집권여당(민주당)이 처음으로 180석을 차지하는 압승을 거뒀고, 제1 보수정당인 통합당은 겨우 개헌 저지선인 103석을 차지하는 데 그쳤다. 중도를 표방한 민생당은 의회에서 사실상 사라졌다.

제21대 국회의원 선거운동이 시작된 4월2일 서울 종로구에 후보자들 현수막이 붙어 있다. ⓒ연합뉴스
제21대 국회의원 선거운동이 시작된 4월2일 서울 종로구에 후보자들 현수막이 붙어 있다. ⓒ연합뉴스

리더십·전략 부재·막말·막천 등이 참패 요인

통합당은 왜 크게 패했을까. 빅데이터 분석은 통합당의 참패 원인을 이미 예견하고 있었다. 경기대 빅데이터센터와 언노운데이터팀은 21대 총선 최대 격전지인 서울 종로를 비롯해 광진을, 동작을, 송파을, 대구 수성을 등 5곳에 대한 빅데이터를 분석했다. 결과적으로 이번 총선에서 이곳 중 민주당은 종로 등 3곳, 통합당 1곳, 무소속은 1곳에서 각각 승리했다. 빅데이터 분석 결과, 통합당의 참패 요인은 △황교안 전 대표의 무능한 리더십 △막가파식 공천 △후보들의 막말 △‘활 vs 총’으로 비유할 수 있는 전략·전술의 낙후 등으로 나타났다. 이 4가지 요인이 악순환을 보여 참패로 이어진 것이다.

 

황교안 전 대표는 시대정신을 읽고 유권자 눈높이에 맞추는 데 실패한 것으로 나타났다. 2016년 국회의원 선거와 2020년 선거 전 빅데이터를 분석한 결과, 선거 승패는 ‘부정적인 연관어 빈도수’에 달려 있었다. 다시 말해 상대 후보보다 부정적인 연관어가 많을수록 떨어질 가능성이 높게 나타난 것이다. 서울 종로의 경우 선거 시작인 3월25일부터 4월14일까지 빅데이터를 분석한 결과, 이낙연 민주당 후보(36.32%)보다 황교안 통합당 후보(47.55%)의 부정적인 연관어 비율이 거의 11%포인트 이상 높게 나타났다. 또한 빅데이터 분석에서 통합당 지지자지만 ‘이낙연 후보를 찍겠다’는 언급이 선거 막판에 많이 나왔다. 교차투표가 실제로 일어날 조짐이 충분했다는 뜻이다.

실제 종로구 비례대표 투표에서 통합당의 위성정당인 미래한국당은 3만987표를 얻고, 민주당의 위성정당인 더불어시민당은 3만539표를 얻어 오히려 미래한국당이 448표 앞섰다. 그러나 지역구 의원 투표에서는 이낙연 후보가 황교안 후보를 무려 1만7308표나 앞섰다.

나경원·오세훈 부정적 연관어, 여당 후보보다 많아

전직 판사 출신 대결로 주목을 받았던 동작을에서는 나경원 통합당 후보(53.28%)의 부정적인 연관어 비율이 이수진 민주당 후보(45.93%)보다 약 7%포인트나 높게 나타났다. 관심을 끌었던 서울 광진을의 경우 고민정 민주당 후보(28.11%)가 오세훈 민주당 후보(33.31%)보다 부정적인 연관어 비율이 낮게 나타났고, 그래서 당선됐다. 최대 격전지였던 서울 동작을과 광진을에서 민주당의 전략공천을 받은 신인들이 잠재적인 대권후보들을 물리친 것이다. 빅데이터 분석에서 신인 고민정 후보는 청와대 대변인, 문재인 대통령의 입으로 비춰지면서 오세훈 후보와는 ‘대통령 대 서울시장’ 대결로 나타났다.

또 이번 빅데이터 분석이 시사하는 바는 잘못된 공천으로 막말을 하는 후보를 공천할 경우 후보의 패배는 물론 선거 전체에도 부정적인 영향을 미치게 된다는 점이다. 김형오 전 통합당 공천위원장과 자매정당인 미래한국당의 공천 파동은 선거 패배 요인 중 하나다. 서울 광진을 오세훈 후보의 경우 선거일에 다가갈수록 긍정적인 연관어가 높아지면서 여론조사와는 달리 반전의 기회가 있는 것으로 나타났다. 실제 오 후보는 선거 당일 투표에서 5000표 차로 이겼음에도 막말 파동이 한창 뜨거웠던 시점의 사전투표에서 7000표 차로 지면서 결국 그 차이를 극복하지 못하고 낙선했다.

반면에 서울 송파을의 경우 배현진 통합당 후보가 여론조사에서는 지는 것으로 나타났으나, 빅데이터 분석에서는 부정적인 연관어가 37.07%로 최재성 민주당 후보(38.87%)보다 그 비율이 낮게 나타났다. 선거일이 다가오면서 배 후보는 긍정적인 연관어 비율이 높아졌고, 실제 승리했다.

전국적인 주목을 받았던 대구 수성을의 경우, 부정적인 연관어보다는 총 언급량에서 무소속 홍준표 후보(4300건)가 이인선 통합당 후보(930건)와 이상식 민주당 후보(518건)를 압도했다. 홍 후보가 이인선 후보보다 4배나 더 많이 언급된 것이다. 이렇듯 빅데이터 분석에서 후보 간 언급량이 3배 이상 차이 날 경우 당선이 유력하다는 패턴에 해당되기 때문에 홍 후보의 승리가 예상됐고, 실제 승리했다.

통합당 후보들의 막말, 즉 황교안 후보의 ‘n번방 호기심’ 발언, 김대호 후보의 ‘30~40대 무지’ 발언, 정승연 후보의 ‘인천 촌구석’ 발언도 이번 선거의 주요 변수가 됐다. 그리고 가장 큰 악영향은 차명진 후보의 ‘세월호’ 발언이다. 이를 당이 처리하는 과정에서 보여준 우유부단함이 수도권 접전 지역에서 많은 후보를 떨어트렸다. 박형준 통합당 공동선대위원장은 “막말 파동으로 30석이 날아갔다”고 말하기도 했다. 빅데이터 분석에서도 막말이나 네거티브 캠페인이 오히려 후보에게 불리하게 작용하는 것으로 나타났다. 네거티브는 부메랑과 같아서 던진 자에게 되돌아온다는 것을 이번 선거가 보여줬다.

시스템 공천으로 승기를 잡은 민주당은 선거 전략전술에서도 압도적인 우위를 보였다. ‘통합당의 재래식 활과 민주당의 첨단 총’의 대결이었다고 비유할 수 있을 정도다. 통합당은 여론조사에만 의존했다면 민주당은 4차 산업혁명 시대의 비밀병기인 빅데이터를 활용해 전략전술을 짜고 폈다. 양정철 전 민주연구원장과 이근형 전 민주당 전략기획위원장은 지역구마다 성별·연령별 유동인구의 동선 시간대를 빅데이터 분석을 통해 파악해 선거운동의 효율화를 꾀했다. 실제 선거운동을 언제 어디에서 할지 빅데이터 자료를 각 후보자에게 전달한 것이다.

 

민주당, 빅데이터 활용해 유권자 동선 파악

필자가 사는 서울 종로구의 경우, 선거 현수막이나 유세지를 이낙연 후보가 선점했다. 반면에 통합당 싱크탱크인 여의도연구원은 전화 여론조사에 의지했다. 서울 노원갑에 출마한 이준석 통합당 후보는 “여의도연구원이 총선 때 제대로 기능했나 강한 의심이 든다”면서 “정책적인 지원이 거의 없었다”고 언론 인터뷰에서 털어놓았다. 정치학자들은 통합당의 참패를 평가하면서 “공부하지 않고 좋은 점수를 받으려 막말하고 떼쓰는 모습”이라고 밝혔다.

그럼 향후 통합당은 어떻게 무너진 보수를 다시 재건할 수 있을까. 독일 기민당의 성공 방식에서 해답을 찾을 수 있다. 평화통일의 주역인 헬무트 콜 전 총리나 대통합의 리더십을 보여주고 있는 14년 집권의 앙겔라 메르켈 같은 정치 리더가 나와야 한다. 한때 소장파로 개혁적인 리더라는 평가를 받았던 ‘남원정’의 원희룡 제주지사 같은 이들이 보수의 새 리더로 부상할 수 있을지 궁금해진다.

관련기사
이 기사에 댓글쓰기펼치기