‘챗GPT 충격’에 승부수 던진 네이버·카카오
  • 이하은 시사저널e. 기자 (grace@sisajournal-e.com)
  • 승인 2023.03.25 16:05
  • 호수 1745
이 기사를 공유합니다

챗GPT, 한글 기반 데이터 및 신뢰성에 문제 지적돼
네이버 검색 기반 ‘서치GPT’, 카카오 채팅 활용한 ‘코GPT’ 주목

먼 미래의 일로 여겨졌던 인공지능(AI) 기술이 일상에 녹아들면서 산업 패러다임 역시 크게 변하고 있다. 국내 양대 플랫폼 기업인 네이버와 카카오 역시 챗GPT가 촉발한 AI 대전에 가세했다. 챗GPT가 한글 기반 데이터나 신뢰성에 문제가 있는 만큼, 독자적으로 구축한 경쟁력으로 초대 규모(하이퍼스케일) AI 시장에 도전한다는 계획이다.

네이버와 카카오가 AI 대전에 바짝 고삐를 당기는 데는 이유가 있다. 챗GPT는 출시 5일 만에 하루 활성이용자 100 만 명을 돌파했고, 세 달 만에 월(月)활성이용자(MAU) 1억 명을 넘어섰다. MAU 1억 명 도달까지 인스타그램은 2년 반, 틱톡은 9개월이 걸렸다. 제한적으로 사용되던 AI가 일상 곳곳에서 활용되며 스마트폰 혁명을 이을 AI 혁명이 성큼 다가왔기 때문이다. 전문가들은 “AI가 향후 검색·업무·노동 등 전 세계 산업의 패러다임을 바꿀 것”이라고 전망하고 있다.

2월27일 서울 중구 달개비에서 뇌과학자 김대식 카이스트 교수가 질문하고 챗GPT가 대답한 《챗GPT에게 묻는 인류의 미래》 출간 기자간담회가 열리고 있다. ⓒ연합뉴스
2월27일 서울 중구 달개비에서 뇌과학자 김대식 카이스트 교수가 질문하고 챗GPT가 대답한 《챗GPT에게 묻는 인류의 미래》 출간 기자간담회가 열리고 있다. ⓒ연합뉴스

스마트폰 혁명 이을 AI 혁명 ‘성큼’

이들 기업은 한국어 특화 모델로 경쟁력을 갖추겠다는 전략이다. 챗GPT는 영어 데이터를 기반으로 학습해온 만큼 아직 한국어 기반 정보가 취약하다. 반면, 국내 기업들이 축적한 한국어 데이터의 양과 질은 글로벌 빅테크보다 우위에 있다. 한국어를 기반으로 자체 서비스에 AI 기술을 접목할 경우 승산이 있다는 셈법이다. 김명주 서울여대 교수도 “챗GPT는 대형 언어모델(LLM)로 특정 언어(영어)를 학습하기 때문에 한글 기반의 데이터양 자체가 한국 기업보다 훨씬 적다”며 “국내 기업은 검색으로 확보할 수 없는 오프라인 자료들, 일정한 권한만 접근할 수 있는 딥 웹(deep web) 자료들을 많이 갖고 있는 만큼 당연히 유리하다”고 설명했다.

네이버의 ‘하이퍼클로바’가 챗GPT의 대항마로 꼽힌다. 네이버는 하이퍼클로바 개발을 위해 2020년 700페타플롭스(PF) 성능의 슈퍼컴퓨터를 도입했다. 1PF는 1초에 1000조 번 수학 연산을 수행할 수 있다. 현재 전 세계에서 두 번째로 빠른 슈퍼컴퓨터인 일본의 후가쿠는 442~537PF, 테슬라가 자율주행차용 AI 탑재를 위해 목표하는 슈퍼컴퓨터는 1000PF 수준이다.

네이버의 하이퍼클로바는 국내 최대 규모의 슈퍼컴퓨팅 인프라를 바탕으로 5600억 개의 한국어 토큰을 학습했다. 기존 네이버 언어모델 데이터와 비교해 약 3000배, GPT-3의 한국어 데이터와 비교해도 약 6500배 이상 많은 양이다. 이는 50년치 뉴스, 9년치 블로그 글에 달한다. 네이버는 하이퍼클로바가 GPT-3의 매개변수(파라미터) 수인 1750억 개보다 많은 2040억 개의 파라미터 규모라고 밝혔다. 매개변수란 인간의 사고 과정에 관여하는 ‘시냅스(Synapse)’에 해당한다. AI에선 매개변수 수에 따라 고도화 여부를 판단한다. 즉, 하이퍼클로바는 한국어를 가장 잘 이해하고 구사할 수 있는 한국어 인공지능 모델인 셈이다.

앞으로 네이버는 하이퍼클로바를 고도화하고, 차세대 검색 프로젝트 ‘서치GPT’를 선보일 방침이다. 서치GPT는 한국어 번역에 한계가 있는 챗GPT의 단점을 해결하고 최신 데이터를 기반으로 신뢰할 만한 정보를 제공할 수 있다는 설명이다. 최수연 네이버 대표는 지난해 4분기 실적 발표 컨퍼런스콜에서 “올해 상반기에 네이버만의 검색 경험인 서치GPT를 선보이는 것이 목표”라며 “(챗GPT 같은) 생성형 AI의 단점으로 꼽히는 신뢰성, 최신성 부족, 비용 효율화 문제를 해결하는 실험의 장을 별도로 선보이겠다”고 말했다.

더 나아가 네이버는 자체 서비스와 결합해 서비스 상용화에 나선다. 오는 7월 네이버는 하이퍼클로바의 기능을 본격적으로 이용할 수 있도록 ‘하이퍼클로바X’를 출시한다. 하이퍼클로바X는 기존 하이퍼클로바와 결합해 고객이 원하는 서비스를 맞춤형으로 제공해줄 전망이다. 이미 네이버는 독거노인을 위한 AI콜 서비스 ‘클로바 케어콜’, 음성 기록 서비스 ‘클로바노트’, 네이버쇼핑 등 10여 개 서비스에 하이퍼클로바를 적용하고 있다. ‘저렴한 노트북을 사는 방법’처럼 조언이 필요한 검색에 다양한 콘텐츠를 활용한 답변을 제시하는 등 커머스와의 연계 가능성도 내비쳤다. 김유원 네이버클라우드 대표는 “하이퍼클로바X의 최대 장점은 커스텀”이라며 “고객이 보유한 데이터를 하이퍼클로바와 결합해 니즈에 맞는 솔루션을 즉각 제공하게 된다. 기업이나 국가 기관은 각각의 목적에 맞게 최적화된 AI 서비스를 만들어 기존에 없던 가치를 만들 수 있을 것”이라고 말했다.

ⓒ시사저널 박정훈
경기도 성남시 판교와 분당에 각각 위치한 카카오와 네이버 사옥ⓒ시사저널 박정훈

네이버·카카오 최대 장점은 한국어 특화

카카오는 ‘코GPT’ 고도화에 집중하고 있다. 2021년 11월 카카오브레인은 60억 개의 파라미터와 2000억 개 토큰의 한국어 데이터를 바탕으로 하는 코GPT를 공개했다. GPT-3(1750억 개)와 비교하면 파라미터 수는 적다. 올 상반기 코GPT의 업그레이드 버전인 코GPT-3.5 역시 매개변수 수는 전과 큰 차이가 없을 전망이다.

카카오는 일부 전문 영역에 특화된 서비스를 통해 차별화를 꾀할 방침이다. 홍은택 카카오 대표는 지난해 4분기 컨퍼런스콜에서 “한국어 특화 AI 모델인 코GPT를 활용해 우리가 잘할 수 있는 날카로운 서비스에 집중할 것”이라며 “연내 전문 영역 특화(버티컬) 서비스를 빠르게 선보이며 경쟁력을 높여 가겠다”고 강조했다. 글로벌 기업과 같은 선상에서 경쟁하는 게 아니라, 틈새시장을 노리겠단 것이다.

이에 따라 카카오는 AI 아티스트 ‘칼로(Karlo)’ 및 헬스케어 AI 판독 등 버티컬 서비스 고도화, 챗봇 기술 확보 등의 방식으로 차별화 전략을 펼 방침이다. 칼로는 1억2000만 장의 이미지에 기반한 이미지 생성 모델이다. 칼로에는 언어·시각·청각 등 다양한 형태의 데이터를 복합적으로 이해하는 기술인 ‘멀티모달’ 기술이 사용됐다. 이는 최근 공개된 GPT-4에 새로 적용된 기술이기도 하다.

또 카카오그룹에서 강조하고 있는 헬스케어 사업에서도 AI 서비스를 출시할 계획이다. 배웅 카카오브레인 최고헬스케어책임자(CHO)는 “흉부 엑스레이 의료영상의 판독문 초안을 생성하는 연구용 데모를 공개하는 게 올해 목표”라며 “판독문 초안 생성 기술의 완성도를 높이는 것과 더불어 이를 시작으로 CT, MRI, 초음파 같은 다양한 모달리티 확장을 고려하고 있다”고 설명했다. 

관련기사
이 기사에 댓글쓰기펼치기