여론조사 없었던 대전 대덕구·동구 개표 결과, 빅데이터 분석 내용과 흡사
대전시가 파란색으로 물들었다. 21대 국회의원 총선거에서 더불어민주당이 대전 지역 선거구 7곳에서 모두 승리했다. 물론 선거 기간 내내 여론조사에서 대부분 민주당 후보들이 앞서 나갔다. 하지만 대덕구와 동구에 대한 여론조사 결과는 없어 깜깜이 선거를 치렀다.
여론조사는 실시하지 않았지만, 빅데이터를 통한 소셜 언급량을 보면 결과를 예상할 수 있었다. 대전시 대덕구와 동구 후보들의 4월 2주차 빅데이터 분석 결과를 조사해 봤다. 전통적으로 보수성향이 강한 대덕구인 만큼 박 영순 민주당 후보의 고전을 예상했다. 하지만 인터넷 언급량을 보면 박 후보가 압도적으로 높다. 감성 연관어를 봐도 붉은색이 전혀 보이지 않는다. 40%를 넘는 부정적 이미지를 보이는 현역인 정용기 후보와 대조적이다. 개표 결과 박 후보는 49.4%의 득표율로, 정용기 통합당 후보(46.2%)를 누르고 당선됐다.
동구는 어땠을까? 역시 장철민 민주당 후보가 언급량과 긍정적 연관어 부분에서 이장우 통합당 후보를 대폭 앞섰다. 지역 선거이기 때문에 언급량이 많지 않아 정확도가 떨어질 수 있지만, 여론조사 표본보다는 많은 수의 의견을 확인할 수 있다. 특히 연관어와 관련한 긍정, 부정 비율을 대비해 비교해볼 필요성이 중요할 것으로 보인다.
대전 지역은 아니지만, 아래는 여론조사 결과가 틀린 대표적 지역인 인천 연수을의 민경욱 통합당 후보와 정일영 민주당 후보의 4월 2주차 언급량과 감성 연관어 그래프다.
여론조사를 보면 민경욱 후보가 근소한 차이로 앞서는 것으로 나왔으나 막상 뚜껑을 열어보니 결과는 반대였다. 아래의 그래프에도 민경욱 후보의 언급량이 정일영 후보의 언급량보다 2배 이상 앞서고 있다. 하지만 문제는 긍정과 부정의 비율에서 민경욱 후보 측 부정 비율이 3배가량 많다는 점이다. 정일영 후보보다 3배 이상 나쁜 이야기가 언급됐다는 뜻이다. 결국, 2배 많은 언급량이 3배 많은 부정 이미지에 묻혀 버렸다.
이제 4차 산업혁명 시대다. 정치권에서도 빅데이터와 인공지능을 이용한 선거 전략을 짜는 것이 필요하다는 얘기도 나온다.