스스로 계획 세우고 실행하는 ‘에이전트’ 기능 강화
엔비디아와 협업해 속도 향상…코딩 능력서 경쟁사 압도
챗GPT 유료 사용자 대상 오늘부터 순차 적용
![[서울=뉴시스] 오픈AI가 복잡한 업무를 스스로 수행하는 최신 인공지능(AI) 모델 'GPT-5.5'를 24일 공개했다. (사진=오픈AI 제공) *재판매 및 DB 금지](https://img1.newsis.com/2026/04/24/NISI20260424_0002119512_web.jpg?rnd=20260424095256)
[서울=뉴시스] 오픈AI가 복잡한 업무를 스스로 수행하는 최신 인공지능(AI) 모델 'GPT-5.5'를 24일 공개했다. (사진=오픈AI 제공) *재판매 및 DB 금지
[서울=뉴시스]이주영 기자 = 오픈AI가 단순한 대답을 넘어 복잡한 업무를 스스로 처리하는 최신 모델 'GPT-5.5'를 24일 전격 공개했다. 이번 모델은 단순히 묻고 답하는 수준을 넘어 코딩, 조사(리서치), 데이터 분석, 문서 작성 등 실제 직장인들이 수행하는 업무 전반을 직접 지원하는 '에이전트(대행자)'형 AI를 표방한다.
"알아서 계획 짜고 실행"…진화한 ‘AI 비서’
처리 속도와 효율성도 대폭 개선됐다. 오픈AI는 엔비디아와 손잡고 하드웨어와 소프트웨어를 최적화했다. 덕분에 이전 모델과 비슷한 속도를 유지하면서도 훨씬 더 많은 데이터를 빠르고 정확하게 처리할 수 있게 됐다.
코딩 능력 '역대급'…구글·앤트로픽 제쳤다
이는 이전 모델인 GPT-5.4(75.1%)는 물론, 경쟁사인 앤트로픽의 최신 모델 '클로드 미토스(82%)'와 '클로드 오퍼스 4.7(69.4%)'을 앞서는 기록이다. 구글의 '제미나이 3.1 프로(68.5%)'와 비교하면 격차는 더 벌어진다.
박사급 수준의 고난도 추론을 평가하는 '인류의 마지막 시험(HLE)'에서는 도구 없이 43.1%를 기록했으나, 웹 검색 등 도구를 활용할 경우 점수가 57.2%까지 수직 상승했다. 이는 현재 AI 기술 수준에서 최상위권에 해당한다는 평가다.
마우스 클릭부터 과학 연구까지…활용도 무궁무진
소프트웨어 이슈 해결 능력을 평가하는 'SWE-벤치 프로'에서도 58.6%를 기록하며 단일 실행으로 해결하는 작업 비율이 늘었다. 코드 작성부터 디버깅, 테스트, 검증까지 개발 전 과정에서 개선된 결과를 보였다.
과학 분야에서의 활약도 기대된다. 다단계 데이터 분석 능력을 측정하는 '제네벤치(GeneBench)'에서 우수한 성적을 거두며, 향후 복잡한 연구 데이터 해석 및 후속 판단이 필요한 전문 영역에서도 널리 쓰일 전망이다.
오픈AI는 고성능 모델 출시에 따른 부작용을 막기 위해 보안 장치도 강화했다. 해킹 등 위험한 사이버 요청에 대해서는 엄격한 거절 기준을 적용하며, AI 기술이 공격자가 아닌 방어자에게 유리하게 쓰이도록 설계했다.
GPT-5.5는 이날부터 챗GPT 플러스, 프로, 비즈니스 등 유료 서비스 이용자와 개발자 도구인 '코덱스'에 순차적으로 적용된다. 특히 최고 사양인 'GPT-5.5 프로' 버전은 기업용 및 프로 이용자들에게 제공될 예정이다.
오픈AI 관계자는 "GPT-5.5는 단순한 언어 모델을 넘어 실질적인 업무 파트너로 진화했다"며 "보안 요건을 갖춘 기업들을 위해 향후 API(응용프로그램 인터페이스) 형태로도 제공할 계획"이라고 밝혔다.
◎공감언론 뉴시스 [email protected]
