논리 추론 벤치마크서 전작 대비 2배 이상 성능 향상
GPT-5.2·오퍼스 4.6 제치고 AAII 1위 탈환
[서울=뉴시스]윤정민 기자 = 구글이 인공지능(AI) '제미나이'의 추론 능력을 강화한 최신 모델을 선보였다. 공신력 있는 글로벌 AI 평가 기관에서 타사 모델을 제치고 세계 1위에 올라 현존 최강 모델임을 입증했다.
구글은 19일(현지 시간) '제미나이 3.1 프로'를 공개했다.
구글은 이 모델이 핵심 추론 능력에서 한 단계 더 발전했다며 고급 추론 기능을 활용해 가장 어려운 문제도 해결할 수 있도록 지원한다고 설명했다.
새로운 논리 패턴을 해결하는 모델 능력을 평가하는 벤치마크 'ARC-AGI-2'에서 제미나이 3.1 프로는 77.1%의 점수를 받았다. 이는 전작(제미나이 3 프로, 31.1%) 대비 두 배 이상 향상된 수치다. 오픈AI 'GPT-5.2'(52.9%), 앤트로픽 '오퍼스 4.6'(68.8%)보다 앞섰다.
코딩 능력 평가 벤치마크인 'SWE-벤치 베리파이드'에서는 오퍼스 4.6(80.8%)과 비슷한 80.6% 점수를 기록하며 최상위권 성능을 보였다. 초고난도 벤치마크로 불리는 '인류의 마지막 시험(HLE)'에서는 도구 미사용 기준 44.4% 점수를 받으며 GPT-5.2(34.5%), 오퍼스 4.6(40%)을 모두 따돌렸다.
이 외 주요 벤치마크에서 좋은 성적을 받은 제미나이 3.1 프로는 이날 프리뷰 버전 공개 직후 글로벌 AI 평가 기관 '아티피셜 애널리시스'에서 '인텔리전스 인덱스' 부문 57점을 기록했다. 현재 전 세계 AI 모델 중 1위다.
제미나이 3.1 프로는 이날 순차 배포된다. 구글 AI 프로, 울트라 등 유료 멤버십 구독자는 제미나이 앱과 노트북LM에서 상향된 사용 한도로 이용할 수 있다. 기업 고객(버텍스 AI, 제미나이 엔터프라이즈)과 개발자(구글 AI 스튜디오, 안티그래비티 등) 프로그램에서도 프리뷰 버전을 이용할 수 있다.
◎공감언론 뉴시스 alpaca@newsis.com