'오픈AI의 12일' 마지막 소식으로 자사 최고급 모델 소개
英 통신 브랜드 'O2'와 명칭 혼동 피하고자 'o2'로 안 해
o1보다 수학·과학 등에 성능 더 뛰어나
[서울=뉴시스]윤정민 기자 = 오픈AI가 자사 인공지능(AI) 모델 'o1'보다 추론 능력이 더 향상된 'o3'를 내년에 출시한다.
오픈AI는 20일(현지시각) '오픈AI의 12일(12 Days of OpenAI)' 12일 차 행사에서 새 AI 모델 'o3'와 소형 모델 'o3 미니'를 소개했다.
o3는 오픈AI가 지난 9월 출시한 'o1'보다 추론 성능에서 향상된 버전이다. o1과 마찬가지로 이용자 질문에 답하기 전에 답을 추론하도록 설계됐다. 수학, 과학, 코딩 등 부문에서 성능이 한층 더 강화됐다.
오픈AI에 따르면 프로그래밍 작업에 초점을 맞춘 벤치마크(SWE-Bench Verified)에서는 o1보다 22.8%포인트(p) 더 높은 성과를 거뒀다. 코딩 기술을 측정하는 지표(Codeforces)에서는 2727점을 기록했다. 엔지니어 상위 99.2%에 해당하는 2400점보다 높은 점수를 기록한 것이다.
미국 수학 경시대회 중 하나인 AIME의 경우 올해 대회에 출제된 문제 중 한 문제만 틀렸다. 대학원 수준의 생물학, 물리학, 화학 문제 시험(GPQA Diamond)에서는 정답률 87.7%를 달성했다.
에포크AI의 프론티어매스 벤치마크에서도 문제의 25.2%를 풀어내는 데 성공했다. 다른 모델은 2%를 넘지 못했었다. 오픈AI 측은 o3가 특정 조건에서 범용인공지능(AGI)에 가까워졌다고 설명했다.
또 o3에는 '추론 시간 조정' 기능이 추가된 게 특징이다. 이용자는 o3가 탑재된 챗GPT에 빠른 답을 얻기 원할 때 o3 사고 시간 높낮이를 조절할 수 있다. 사고 시간을 '높음'으로 설정할수록 답변을 받을 시간이 느려지지만 추론 성능은 더 좋아진다.
오픈AI는 현재 마이크로소프트 '코파일럿 랩'을 통해 일부 연구자에게 o3를 미리보기 형태로 제공하고 있다. 샘 올트먼 오픈AI 최고경영자(CEO)는 "내년 1월 말에 'o3 미니'를 먼저 출시하며 이후 'o3'를 출시할 예정"이라고 밝혔다. 모델명이 'o2'가 아닌 o3로 지은 이유에 대해서는 "영국 통신사 'O2'를 존중하는 차원"으로 혼동을 피하고 싶었기 때문이라고 전했다.
◎공감언론 뉴시스 alpaca@newsis.com