구글 AI '제미나이' 시연영상은 편집본…GPT-4 의식했나

기사등록 2023/12/10 17:36:53

'제미나이 울트라' 현존 최강의 AI 모델이라더니

'제미나이' 시연영상은 실시간 아닌 편집 영상

구글 "제미나이와의 상호작용 보여준 예시"

[뉴욕=AP/뉴시스]사진은 미국 뉴욕에 위치한 구글 본사의 간판. 2023.12.05.
[서울=뉴시스] 오동현 기자 = 현존하는 가장 뛰어난 인공지능(AI) 모델이라 주장하던 구글의 '제미나이(Gemini)'가 성능 논란에 휩싸였다. 최근 구글이 공개한 시연 영상이 사전에 편집된 것으로 드러나면서 성능 의혹이 불거진 것이다. 구글이 경쟁 상대인 오픈AI의 대규모언어모델(LLM) 'GPT-4'에 맞서기 위해 '제미나이'를 서둘러 공개한 것 아니냐는 지적을 받고 있다.

8일(현지시간) 미국의 CNBC에 따르면, 구글이 공개한 6분 분량의 '제미나이' 시연 동영상에는 사용자와 챗봇 간의 음성 대화가 포함돼 있으며, 제미나이가 사진과 실제 물체를 인식하고 그 차이를 알아내는 능력도 보여줬다. 특히 '제미나이'가 음성으로 오리 그림에 대해 설명하는 등 몇 가지 기능이 인상적이었다고 CNBC는 전했다.

하지만 해당 시연 영상은 실시간이 아닌 사전에 편집된 영상이라는 것이 알려졌고, 구글도 이를 시인했다. 구글은 CNBC를 통해 "이 동영상은 실제 멀티모달 프롬프트와 테스트 결과를 바탕으로 제미나이와 상호작용할 수 있는 가능성을 보여주는 예시"라고 해명했다. 또 "12월 13일 제미나이 프로에 대한 액세스가 오픈되면 사람들이 어떤 결과물을 만들어낼지 기대된다"고 전했다.

구글은 지난 6일 "지금까지 개발한 가장 유능하고 범용적인 AI 모델"이라며 '제미나이'를 공개했다. 특히 처음부터 멀티모달로 설계된 차세대 AI 모델이라며 텍스트, 오디오, 이미지, 영상 등 모든 종류의 입력값을 원활하게 이해하고 추론할 수 있으며, 기존 멀티모달 보다 거의 모든 영역에서 가장 앞선 성능을 보였다고 자평한 바 있다.

구글이 발표한 '제미나이'는 세 가지 버전이 있다. 특히 방대하고 복잡한 작업에 적합한 최대 규모 모델 '제미나이 울트라'의 성능은 업계에서 LLM 연구개발 평가에서 주로 사용되는 32개의 벤치마크 중 30개에서 기존의 최신 기술을 뛰어넘는 결과를 보여줬다고 강조했다. GPT-4의 성능을 넘어섰다는 주장이었다.

또 '제미나이 울트라'는 수학, 물리학, 역사, 법률, 의학, 윤리 등 총 57개의 주제를 복합적으로 활용해 세계 지식과 문제 해결 능력을 평가하는 MMLU(대규모 멀티태스크 언어 이해) 테스트에서 90.04%의 점수를 기록, 전문가보다 높은 결과를 기록한 최초의 모델이라고 구글은 설명했다.

[보스턴=AP/뉴시스]지난달 21일(현지시간) 미국 보스턴에서 한 사용자가 컴퓨터로 인공지능(AI) 챗봇 '챗(Chat)GPT'를 사용하고 있다. 화면 앞에는 챗GPT를 개발한 오픈 AI 로고가 스마트폰 화면에 떠 있다. 2023.04.06.
먼저 구글은 다양한 작업에서 가장 적합한 모델 '제미나이 프로'를 AI 챗봇 '바드'에 탑재했다. 한국 등 170여 개 국가에서 영어로 이용 가능하다. '제미나이 울트라'를 적용한 '바드 어드밴스드(Bard Advanced)'는 내년 초에 선보일 예정이다.

 최근 미국 디인포메이션 등 외신에 따르면 당초 구글은 '제미나이'를 대중에 공개할 예정이었다. 하지만 최종 테스트 과정에서 비영어권 프롬프트 오류가 발견돼 공개를 내년 초로 연기할 것이란 외신 보도가 있었다. 그런데 구글이 제미나이의 시연 영상을 깜짝 공개한 것이다.

이를 두고 CNBC는 "데자뷰를 불러일으킨다"고 전했다. 구글은 올초 '바드'를 처음 공개했을 당시 대중과 월가로부터 "서둘러서 엉망으로 만든 AI 챗봇"이라는 비판을 받았다. 당시 마이크로소프트가 챗GPT와 빙(Bing)의 통합을 발표할 예정이었기 때문에, 구글이 AI 검색 시장에서 밀리지 않기 위해 바드를 서둘러 공개했을 것이란 시각도 적지 않았다. 이후에도 구글은 마이크로소프트의 지원을 받는 오픈AI와 치열한 AI 경쟁을 벌이고 있다.

CNBC에 따르면 구글은 먼저 바드에 탑재한 '제미나이 프로'가 챗GPT-3.5에 비해선 성능이 뛰어난 것은 맞지만, GPT-4와 비교했을 때 어떤 수준인 지에 대해선 답을 피한 것으로 전해졌다. 다만 구글은 '제미나이 울트라'가 여러 벤치마크에서 오픈AI의 GPT-4보다 성능이 뛰어나다고 주장하고 있다.


◎공감언론 뉴시스 odong85@newsis.com