“인간의 지식은 필요 없다”는 알파고 제로

백지 상태서 자신과의 대국만으로 성장한 ‘알파고 제로’의 등장

아무리 똑똑한 인공지능일지라도 학습을 시작할 때는 인간의 지식을 자양분으로 삼았다. 알파고도 그랬다. 인류가 만든 게임 중 전략성이 가장 큰 바둑을 정복하기 위해 구글 산하의 딥마인드는 ‘알파고(AlphaGo)를 개발했다. 알파고는 결국 바둑으로 인간을 이겼지만 승리의 바탕에는 바둑 기사들이 축적한 수천 개의 기보가 있었다. 바둑의 발상지인 중국에서, 세계 최고 기사인 커제 9단을 3대0으로 물리친 2017년 5월, 알파고는 바둑계에서 은퇴를 선언했다. 2016년 이세돌 9단이 패했고 올해 커제 9단마저 졌으니, 인간계에서 알파고와 대적할 맞수는 더 이상 없었다.

다만 알파고가 소멸한 건 아니었다. 데미스 하사비스 딥마인드 CEO는 “최고의 기회를 경험한 알파고를 은퇴시키기로 했다. 하지만 알파고 개발팀은 다음 단계를 위한 개발에 주력할 것이다. 알고리즘을 보다 범용으로 개조해 세상에 존재하는 복잡한 문제를 해결하는데 알파고가 도움이 될 수 있으면 좋겠다고 생각하고 있다”고 말했다.

그의 약속은 오래지 않아 실현됐다. 딥마인드는 10월18일 과학학술지 ‘네이처’를 통해 ‘알파고제로(AlphaGo Zero)'를 공개했다. 흥미로운 점은 이세돌을 상대했던 ’알파고‘와 벌인 바둑 대국의 결과다. 딥마인드가 밝힌 ’알파고제로 vs 알파고‘의 대국 결과는 100대0이었다. 커제와 대결했던 ’알파고마스터(알파고의 진화 버전)‘와도 대결했는데 알파고 제로는 89대11로 압도했다.

딥마인드는 10월18일, 자기 자신과의 대국만으로 학습한 인공지능 '알파고 제로'를 공개했다. 자기 자신과의 대국만으로 학습한 '알파고 제로'는 단 3일 만에 이세돌 9단이 겨뤘던 '알파고'를 100대0으로 꺾었다.

빅데이터 학습이 필요 없는 인공지능의 등장

알파고와 달리 알파고제로는 인간의 기보를 아예 배제했다. 대신 자기 자신과의 대국만으로 바둑을 배웠다. 처음에는 바둑을 처음 접하는 사람처럼 두었지만 3일 째에는 이세돌을 이긴 알파고를 물리쳤고 40일 째에는 커제를 이긴 알파고 마스터마저 껐었다. 자신 스스로가 교사가 된다는, 새로운 강화학습이 만들어낸 결과였다.

알파고 제로가 알파고를 꺾은 결과보다 주목받은 건 학습 과정이다. 하사비스 CEO가 강조한 ‘범용’이라는 키워드에 어울리는 인공지능이기 때문이다. 바둑에 관해 백지상태에서 시작했지만 강력한 검색 알고리즘과 결합해 자기 자신과 대국하며 스스로 조정과 업데이트를 거듭했다. 인간이 갖고 있는 지식과 그 한계에 얽매이지 않은 채 결과를 냈다.

그동안 알파고와 같은 인공지능은 능력을 발휘하기 위해서는 딥러닝을 하기 위한 ‘빅데이터’가 필요했다. 하지만 기보가 축적된 바둑과 달리 빅데이터 확보가 어려운 분야도 많다. 알파고 제로는 그 해결책을 보여준 셈이다. 딥마인드 측은 “알파고 제로의 성공은 빅데이터 확보가 어려운 신약 개발이나 에너지 절약 대책 등의 분야에서 돌파구가 될 가능성이 있다”고 설명했다. 인류가 직면하는 폭넓은 문제를 해결하는 역할에 알파고제로가 응용될 수 있다는 얘기다.

김회권 기자 다른기사 보기

이 기사에 댓글쓰기펼치기