여론조사보다 정확한 빅데이터 선거 분석?
  • 김상현 세종취재본부 기자 (sisa411@sisajournal.com)
  • 승인 2020.04.16 15:15
이 기사를 공유합니다

대전 지역 선거 향배, 빅데이터는 알고 있었다
여론조사 없었던 대전 대덕구·동구 개표 결과, 빅데이터 분석 내용과 흡사

대전시가 파란색으로 물들었다. 21대 국회의원 총선거에서 더불어민주당이 대전 지역 선거구 7곳에서 모두 승리했다. 물론 선거 기간 내내 여론조사에서 대부분 민주당 후보들이 앞서 나갔다. 하지만 대덕구와 동구에 대한 여론조사 결과는 없어 깜깜이 선거를 치렀다.

여론조사는 실시하지 않았지만, 빅데이터를 통한 소셜 언급량을 보면 결과를 예상할 수 있었다. 대전시 대덕구와 동구 후보들의 4월 2주차 빅데이터 분석 결과를 조사해 봤다. 전통적으로 보수성향이 강한 대덕구인 만큼 박 영순 민주당 후보의 고전을 예상했다. 하지만 인터넷 언급량을 보면 박 후보가 압도적으로 높다. 감성 연관어를 봐도 붉은색이 전혀 보이지 않는다. 40%를 넘는 부정적 이미지를 보이는 현역인 정용기 후보와 대조적이다. 개표 결과 박 후보는 49.4%의 득표율로, 정용기 통합당 후보(46.2%)를 누르고 당선됐다.

대덕구
다음소프트에서 운영 중인 SomeTrend에서는 트위터, 블로그, 인스타그램과 뉴스에서 해당 키워드를 분석해 언급량과 연관어를 분석하는 서비스를 제공한다. SomeTrend를 통해 분석한 대전 대덕구 후보 언급량과 연관어 긍정·부정 비율 ©Daumsoft

동구는 어땠을까? 역시 장철민 민주당 후보가 언급량과 긍정적 연관어 부분에서 이장우 통합당 후보를 대폭 앞섰다. 지역 선거이기 때문에 언급량이 많지 않아 정확도가 떨어질 수 있지만, 여론조사 표본보다는 많은 수의 의견을 확인할 수 있다. 특히 연관어와 관련한 긍정, 부정 비율을 대비해 비교해볼 필요성이 중요할 것으로 보인다.

동구
SomeTrend를 통해 분석한 대전 동구 후보 언급량과 연관어 긍정·부정 비율 ©Daumsoft

대전 지역은 아니지만, 아래는 여론조사 결과가 틀린 대표적 지역인 인천 연수을의 민경욱 통합당 후보와 정일영 민주당 후보의 4월 2주차 언급량과 감성 연관어 그래프다.

여론조사를 보면 민경욱 후보가 근소한 차이로 앞서는 것으로 나왔으나 막상 뚜껑을 열어보니 결과는 반대였다. 아래의 그래프에도 민경욱 후보의 언급량이 정일영 후보의 언급량보다 2배 이상 앞서고 있다. 하지만 문제는 긍정과 부정의 비율에서 민경욱 후보 측 부정 비율이 3배가량 많다는 점이다. 정일영 후보보다 3배 이상 나쁜 이야기가 언급됐다는 뜻이다. 결국, 2배 많은 언급량이 3배 많은 부정 이미지에 묻혀 버렸다. 

인천 연수을
SomeTrend를 통해 분석한 인천 연수을 후보 언급량과 연관어 긍정·부정 비율 ©Daumsoft

이제 4차 산업혁명 시대다. 정치권에서도 빅데이터와 인공지능을 이용한 선거 전략을 짜는 것이 필요하다는 얘기도 나온다.

관련기사
이 기사에 댓글쓰기펼치기