‘빅데이터’로 살펴본 김정은 vs 트럼프의 생각
  • 이진원 데이터 저널리스트 (sisa@sisajournal.com)
  • 승인 2019.03.01 15:00
  • 호수 1533
이 기사를 공유합니다
北 “트럼프 좋지만 미국은 싫어” 美 “金 신뢰한다…시간이 해결”

지난 1년간 북한은 미국을 중심으로 한 국제정세 분석에 집중했고, 미국은 기대감을 높이기 위한 협상에 주력한 것으로 ‘키워드 분석’ 결과 드러났다. 이번 빅데이터 분석은 북·미 관계가 급속도로 가까워진 지난 1년 동안 양국이 각자 어떤 생각으로 협상에 임했는지를 살펴보기 위해 진행됐다.  

北, 트럼프는 옹호하되 美 언론은 비난 

노동신문에서 미국과 연관 지어 가장 많이 사용된 단어는 북한을 지칭하는 ‘우리나라’였다. 그다음으로 △이란(242건) △제재(175건)였다. 이는 대미 협상에 있어 북한이 미국-이란 관계를 중요하게 참고하고 있다는 뜻으로 해석된다. 경우에 따라서는 이란의 대미 협상을 반면교사 삼으려는 경향도 엿볼 수 있다. 일례로 노동신문은 2월1일자 ‘날로 긴장해지는 이란-미국 관계’란 제목의 해설 기사에서 관련 내용을 집중 분석했다. 또 지난해 5월 미국의 이란 핵합의 탈퇴가 있던 때에도 관련 뉴스를 집중적으로 다뤘다. 지난해 2월23일자 ‘중동정세를 격화시키는 미국의 지배전략’ 기사에서 노동신문은 미국이 풍부한 지하자원, 정치군사적 요충지 등의 이유로 이란을 포함한 중동에서 경제적 이익과 지배권을 동시에 추구한다며 강도 높게 비난했다. 아울러 △세계(100건) △군사(85건) △관계(82건) 등의 키워드도 노동신문에 많이 등장했다. 또, 이란과 함께 러시아·쿠바·캄보디아·터키·독일·파키스탄 등 최근 미국과 외교관계가 좋지 않은 국가들의 소식도 입체적으로 분석했다.  

‘트럼프’(80건)라는 단어도 꽤 언급했다. 흥미로운 점은 노동신문이 미국에 대해서는 다소 거칠게 표현하지만 협상 파트너인 트럼프 대통령에 대해선 자극적인 언급을 자제하고 있다는 점이다. ‘트럼프’란 단어의 연관어를 분석하면 대통령·행정부·집권·패거리·핵합의문·트위터·정치 등이 많이 나왔다. 오히려 노동신문은 1차 북·미 회담 결과를 비판하는 미국 언론을 비난하면서 트럼프 대통령을 감싸고 있다. △인권(78건) △핵(67건) 등은 북한 입장에선 거론하기 부담스러운 단어다. 이 중 인권의 관련어로는 타령·유린·옹호·행세·모략·객관·험담 등 부정적 표현이 많았다.  

형용사 분석에서는 △새로운(31건) △강력한(20건)이 가장 많이 사용됐다. 이는 앞으로 전개될 북·미 관계에 대한 기대감이 반영됐다고 봐야 한다. 동사·형용사 분석 중 긍정 혹은 부정적 감정 표현이 등장하지 않고 중립적인 단어들이 많이 사용된 것이 이를 방증한다. 긍정적 의미의 동사·형용사로는 △높은 △좋다 △가까운 △밀접한 △눈부신 △커다란 △변하다 등이 있었다. 부정적 단어로는 △당하다 △아무런 △심각한 △복잡한 △여전히 △어리석다 △불과하다 △힘들다 △불가능하다 △미친 △거슬리다 등이 있었다. 

그러면 트럼프 대통령은 북한에 대해 어떤 생각을 갖고 있을까. 지난 1년간 트럼프 대통령의 개인 트위터에서 북한과 관련해 가장 많이 나온 단어는 △김정은(북한 국무위원장)으로 22건이 사용됐다. 노동신문의 키워드 빈도수 분석에서 ‘트럼프’라는 말이 9번째로 많이 쓰인 것과 대조를 보인다. 트럼프 대통령은 트위터를 통해 김 위원장에 대한 직접적 평가를 많이 하지 않았다. 대신 수시로 김정은 위원장과의 관계 및 의사소통 내용을 강조했다. 2017년과 2018년 초만 해도 김 위원장을 ‘로켓맨’이라고 불렀지만 지난 1년 동안에는 이름과 공식 직함을 많이 사용했다. 연관어로는 지도력·증명·믿음·같이·진전 등의 단어를 많이 사용해 김 위원장을 대화 파트너로 인정하려는 노력도 엿보인다. 김정은 다음으로 많이 쓰인 단어는 △시간(11건)이다.   

트럼프, ‘로켓맨’ 아닌 정식 호칭 사용

트럼프 대통령 트위터에서 북한과 관련해 세 번째로 많이 쓰인 단어는 △가짜뉴스(10건)다. 트럼프 대통령은 이 단어와 함께 해당 언론사를 직접 언급하거나 서구 미디어 전체를 강하게 비판했다. 6월13일 트위터에서 트럼프 대통령은 “NBC, CNN 등 가짜뉴스들은 북한과의 거래를 무시하기 위해 열심히 싸우고 있다”며 “미국의 가장 큰 적은 가짜뉴스이며 어리석은 자들을 통해 널리 퍼지고 있다”고 조롱했다. 

이어 △정상회담(meeting, summit, talk) △거래(deal) 등의 단어를 많이 사용하며 북·미 정상회담 관련 소식들을 발 빠르게 전했다. 주변국에 대한 언급도 있었다. 빈도수는 △중국(6건) △일본(5건) △싱가포르(4건) △한국(3건) 순이었다. 인물로는 △시진핑(3건) △아베(2건) △폼페이오(2건) △오바마(2건) △척슈머(2건) △펠로시(1건) △문재인(1건) 순으로 나왔다. 이는 북·미 관계에 있어 트럼프 대통령이 중국과 시진핑 중국 국가주석의 움직임을 예의주시하고 있음을 보여준다. 북·미 협상의 주요 이슈인 △핵 △비핵화는 각각 8회, 5회씩 언급돼 상대적으로 비중이 낮았다. 이는 트럼프 대통령 역시 가장 민감하고 뜨거운 이슈에 대해서는 최소한으로 언급하려는 의도로 볼 수 있다.   

한편 감정분석에 있어서는 80%가 중립적인 단어로 나왔다. 다만 형용사·동사 분석에서 긍정적 단어들이 상위권에 대거 포진했다. 주요 키워드로는 △좋다(good, 16건) △대단하다(great, 14건) △우선(first, 7건) △큰(big, 6건) △믿는다(believe, 5건) △만족한다(happy, 4건) △지켜본다(see, 4건) △생산적(productive, 2건) 순이었다. 부정적 단어로는 △나쁘다(bad, 3건) △왜곡된(distorted, 1건) △끔찍한(horrendous, 1건) 정도가 눈에 띄었다. 

어떻게 조사했나

시사저널은 국내 언론 최초로 북한 노동당 기관지인 노동신문의 보도 동향과 논조를 자연어 처리분석(Natural Language Processing) 방식으로 분석했다. 미국 정부의 생각은 도널드 트럼프 대통령의 트위터에 올라온 북한 관련 소식을 토대로 했다. 관계당국의 허락 없이 북한 사이트에 접속할 경우 실정법에 저촉될 수 있지만 언론 보도나 학술 연구 등 공익적 차원에서는 가능하다는 생각에 분석에 나섰다. 노동신문 기사에서는 ‘미국’을, 트럼프 대통령 트위터에서는 ‘North Korea’(북한)를 검색어로 썼다. 이를 토대로 파이썬을 통해 키워드를 분석했으며 기간은 2018년 1월1일부터 2019년 2월20일까지로 한정했다. 

이 기사에 댓글쓰기펼치기