“GPT-4도 인간도 뛰어넘었다”…구글, AI 언어모델 ‘제미나이’ 공개

'알파고' 아버지 데미스 허사비스가 프로젝트 주도
이미지·음성·영상 등 상호작용 가능한 ‘멀티모달 AI’로 개발
대규모 다중작업 언어 이해 점수 90%…추론 능력도 갖춰

구글이 인간의 능력을 뛰어넘는 대규모 언어모델(LLM) '제미나이'(Gemini)를 공개했다.

구글은 6일(현지 시각) 오픈AI의 최신 모델인 'GPT-4'보다 성능이 우수하고 인간 전문가의 능력을 뛰어넘는 LLM 제미나이를 공개했다. 구글은 지난 4월 AI 조직인 구글브레인과 딥마인드를 구글 딥마인드로 통합하고, 제미나이를 개발해왔다. 바둑 AI '알파고'의 아버지로 유명한 데미스 허사비스가 프로젝트를 주도하고 있다.

제미나이는 코딩 능력까지 갖춘 '멀티모달 AI'로 만들어졌다. 멀티모달은 시각, 청각 등을 활용해 텍스트 뿐만 아니라 이미지, 음성, 영상 등으로 상호작용하는 것을 말한다. 또 제미나이는 추론 능력을 갖추고 있기 때문에 수학 문제를 풀거나 데이터를 분석할 수도 있다.

제미나이는 머신 러닝의 규모에 따라 울트라(Ultra)와 프로(Pro), 나노(Nano) 등 3개 모델로 출시된다. 머신 러닝은 인간의 학습능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술을 말한다.

가장 범용으로 쓰이는 '제미나이 프로'는 이날부터 구글의 AI 챗봇 서비스인 '바드'에 탑재된다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다. '제미나이 나노'는 클라우드 연결 없이 디바이스 자체에서 가벼운 AI를 즉각적으로 활용하는 온디바이스 형태로 접목된다. 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀8 프로'에 탑재된다.

가장 고성능인 '제미나이 울트라'는 내년 초 '바드 어드밴스트'라는 이름으로 바드에 적용된다. 구글은 제미나이 울트라의 경우 대규모 다중작업 언어 이해(MMLU)에서 90%의 정답률을 기록했다고 설명했다. MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 50여 개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 테스트다.

제미나이는 GPT-4의 정답률인 86.4%는 물론 인간 전문가의 89.8%도 뛰어넘은 최초의 모델이라고 구글은 강조했다. 또 현재 가장 우수한 모델과 비교해 "32개 지표 중 30개에서 앞섰다"며 현재까지 성능이 가장 우수하다고 평가되는 GPT-4보다 뛰어나다고 설명했다.

제미나이는 구글이 자체 개발한 AI 칩(TPU v4·v5e)으로 학습했다. 구글은 최첨단 AI 모델을 학습시키기 위해 설계한 최신 칩(클라우드 TPU v5p)도 공개하며 제미나이의 향후 개발을 가속화할 예정이라고 덧붙였다.

순다르 피차이 구글 최고경영자(CEO)는 "첫 번째 버전인 제미나이 1.0은 구글 딥마인드의 비전을 처음으로 실현했다"며 "구글이 개발한 가장 포괄적이고 뛰어난 AI 모델"이라고 설명했다.

이주희 디지털팀 기자 다른기사 보기

가출 여중생에 ‘졸피뎀 음료’ 먹여 강간한 30대男의 최후 ‘조계종 실세’ 자승 스님 의문에 싸인 죽음의 원인 여고생에 입던 속옷 보낸 40대 변호사…항소했지만 ‘가중 처벌’ 부산엑스포 후폭풍은 현재진행형…‘청구서’ 받아든 재계 길 걷다 참변…‘압구정 롤스로이스 돌진’ 20대 피해자 끝내 사망 며느리 흉기 살해한 70대 시아버지…범행 동기는 ‘피해망상’? “쥐XX 들려” vs “청취 불능”…격론 펼쳐진 주호민子 특수교사 재판 근무 시간에 단추 풀고 ‘노출방송’…7급 女공무원 연쇄 일탈 파장 기름 때 끼기 쉬운 혈관…깨끗하게 청소하는 법 3 추울 때 하는 운동이 살 더 잘 빠지는 이유는?

이 기사에 댓글쓰기펼치기