오픈AI, GPT-5.2 공개…제미나이3에 묵직한 견제구

기사등록 2025/12/12 11:06:21 최종수정 2025/12/12 12:06:25

44개 직종 작업에서 인간 전문가 이상 평가

코딩·SW엔지니어링 능력↑…오류 발생률↓

[서울=뉴시스] 오픈AI는 홈페이지를 통해 새 AI 모델 시리즈인 GPT-5.2를 출시한다고 11일(현지시간) 밝혔다. (사진=오픈AI 홈페이지) *재판매 및 DB 금지

[서울=뉴시스]이주영 기자 = 실제 업무 환경에 최적화된 챗GPT의 새로운 버전 GPT-5.2가 공개됐다. 구글 제미나이 3가 예상 밖으로 흥행하면서 오픈AI의 새 모델 출시가 앞당겨졌다는 분석이다.

오픈AI는 홈페이지를 통해 새 AI 모델 시리즈인 GPT-5.2를 출시한다고 11일(현지시간) 밝혔다. GPT-5.2는 일반 지능, 장기적인 맥락 이해, 비서 도구 호출 등에서 이전 모델보다 개선됐다.

GPT-5.2는 즉답, 사고, 프로 모드 총 3가지로 구성된다. 즉답 모드는 정보 탐색과 같은 일상 업무와 학습에 적합하도록 빠른 답변을 내린다. 사고 모드는 코딩, 긴 문서 요약 등 복잡한 작업을 돕는 데 특화됐다. 프로 모드는 답변 시간이 좀 더 걸리지만 까다로운 질문에 가장 고품질의 답변을 내놓는다.

GPT-5.2 사고 모드는 프레젠테이션 제작, 스프레드시트 작성 등 44개 직종에 요구되는 특정 지식 작업 과제를 측정하는 GDPval 평가에서 인간 전문가 수준 또는 그 이상의 점수를 기록했다. 오픈AI 전문가 평가단에 따르면 사고 모드는 10개 중 7개 항목에서 업계 최고 전문가와 동등하거나 그 이상의 성능을 보였다.

코딩 능력도 향상됐다. GPT-5.2는 파이썬을 포함한 네 가지 언어를 평가 항목으로 다양한 산업 현장과 관련된 코딩 능력을 시험하는 테스트에서 GPT-5.1보다 높은 점수를 기록했다.

소프트웨어 엔지니어링 능력은 제미나이 3 프로를 웃돌았다. SWE 벤치마크에서 제미나이 3 프로는 76.2%를 기록했지만 GPT-5.2 사고 모드는 80% 점수를 얻었다.

특히 프런트엔드 개발, 사용자 인터페이스(UI) 작업, 3D 작업을 위한 프롬프트 생성에서 전작보다 뛰어난 사고력을 보였다.

오류 발생률도 전작보다 낮아졌다. GPT-5.1은 오류 응답률이 8.8%였으나 새 모델에서는 6.2%로 나타났다.

긴 문서를 읽고 정보를 추출하는 오픈AI의 자체 평가에서도 새 모델을 최고 성능을 달했다. 보고서, 계약서, 연구 논문, 녹취록과 같은 긴 문서를 더욱 정확하게 분석하고 종합할 수 있게 된 것이다.

새 버전은 이날부터 유료 구독자에게 순차적으로 업데이트될 예정이다. 기존 모델인 GPT-5.1은 3개월 후 서비스 종료된다. 개발자들은 API를 통해 즉시 이용 가능하다.

오픈AI가 새 모델을 이르게 공개한 배경에는 구글과 앤트로픽과 같은 AI 모델을 견제하기 위함이라는 의견이 나온다. 앞서 샘 올트먼 최고경영자(CEO)는 챗GPT 개선을 위한 '코드 레드(Code Red)'를 선언한 바 있다.


◎공감언론 뉴시스 zoo@newsis.com