오픈AI, ‘일하는 AI’ GPT-5.5 전격 공개…“코딩·리서치 스스로 척척”

스스로 계획 세우고 실행하는 ‘에이전트’ 기능 강화

엔비디아와 협업해 속도 향상…코딩 능력서 경쟁사 압도

챗GPT 유료 사용자 대상 오늘부터 순차 적용

[서울=뉴시스] 오픈AI가 복잡한 업무를 스스로 수행하는 최신 인공지능(AI) 모델 'GPT-5.5'를 24일 공개했다. (사진=오픈AI 제공) *재판매 및 DB 금지

[서울=뉴시스]이주영 기자 = 오픈AI가 단순한 대답을 넘어 복잡한 업무를 스스로 처리하는 최신 모델 'GPT-5.5'를 24일 전격 공개했다. 이번 모델은 단순히 묻고 답하는 수준을 넘어 코딩, 조사(리서치), 데이터 분석, 문서 작성 등 실제 직장인들이 수행하는 업무 전반을 직접 지원하는 '에이전트(대행자)'형 AI를 표방한다.

"알아서 계획 짜고 실행"…진화한 ‘AI 비서’

GPT-5.5의 가장 큰 특징은 '스스로 생각하고 행동하는 능력'이다. 사용자가 복잡한 과제를 던지면, AI가 여러 단계의 작업 계획을 세운 뒤 필요한 도구를 찾아 직접 수행한다. 작업 중간에 결과를 스스로 점검하고 다음 단계로 확장하는 등 사람의 개입을 최소화한 것이 특징이다.

처리 속도와 효율성도 대폭 개선됐다. 오픈AI는 엔비디아와 손잡고 하드웨어와 소프트웨어를 최적화했다. 덕분에 이전 모델과 비슷한 속도를 유지하면서도 훨씬 더 많은 데이터를 빠르고 정확하게 처리할 수 있게 됐다.

코딩 능력 '역대급'…구글·앤트로픽 제쳤다

성능 지표에서도 압도적인 수치를 기록했다. 실제 개발 환경과 유사한 코딩 능력을 평가하는 '터미널 벤치 2.0'에서 GPT-5.5는 82.7%의 점수를 받았다.

이는 이전 모델인 GPT-5.4(75.1%)는 물론, 경쟁사인 앤트로픽의 최신 모델 '클로드 미토스(82%)'와 '클로드 오퍼스 4.7(69.4%)'을 앞서는 기록이다. 구글의 '제미나이 3.1 프로(68.5%)'와 비교하면 격차는 더 벌어진다.

박사급 수준의 고난도 추론을 평가하는 '인류의 마지막 시험(HLE)'에서는 도구 없이 43.1%를 기록했으나, 웹 검색 등 도구를 활용할 경우 점수가 57.2%까지 수직 상승했다. 이는 현재 AI 기술 수준에서 최상위권에 해당한다는 평가다.

마우스 클릭부터 과학 연구까지…활용도 무궁무진

GPT-5.5는 단순히 텍스트만 다루는 것이 아니라 컴퓨터 환경을 직접 제어하는 능력도 갖췄다. 화면을 인식해 직접 클릭하거나 입력하고 페이지를 탐색하는 식이다. 이를 통해 복잡한 소프트웨어 업무를 사람 대신 수행할 수 있다.

소프트웨어 이슈 해결 능력을 평가하는 'SWE-벤치 프로'에서도 58.6%를 기록하며 단일 실행으로 해결하는 작업 비율이 늘었다. 코드 작성부터 디버깅, 테스트, 검증까지 개발 전 과정에서 개선된 결과를 보였다.

과학 분야에서의 활약도 기대된다. 다단계 데이터 분석 능력을 측정하는 '제네벤치(GeneBench)'에서 우수한 성적을 거두며, 향후 복잡한 연구 데이터 해석 및 후속 판단이 필요한 전문 영역에서도 널리 쓰일 전망이다.

오픈AI는 고성능 모델 출시에 따른 부작용을 막기 위해 보안 장치도 강화했다. 해킹 등 위험한 사이버 요청에 대해서는 엄격한 거절 기준을 적용하며, AI 기술이 공격자가 아닌 방어자에게 유리하게 쓰이도록 설계했다.

GPT-5.5는 이날부터 챗GPT 플러스, 프로, 비즈니스 등 유료 서비스 이용자와 개발자 도구인 '코덱스'에 순차적으로 적용된다. 특히 최고 사양인 'GPT-5.5 프로' 버전은 기업용 및 프로 이용자들에게 제공될 예정이다.

오픈AI 관계자는 "GPT-5.5는 단순한 언어 모델을 넘어 실질적인 업무 파트너로 진화했다"며 "보안 요건을 갖춘 기업들을 위해 향후 API(응용프로그램 인터페이스) 형태로도 제공할 계획"이라고 밝혔다.

◎공감언론 뉴시스 [email protected]

오픈AI, ‘일하는 AI’ GPT-5.5 전격 공개…“코딩·리서치 스스로 척척”

스스로 계획 세우고 실행하는 ‘에이전트’ 기능 강화

엔비디아와 협업해 속도 향상…코딩 능력서 경쟁사 압도

챗GPT 유료 사용자 대상 오늘부터 순차 적용

"알아서 계획 짜고 실행"…진화한 ‘AI 비서’

코딩 능력 '역대급'…구글·앤트로픽 제쳤다

마우스 클릭부터 과학 연구까지…활용도 무궁무진

오픈AI, ‘일하는 AI’ GPT-5.5 전격 공개…“코딩·리서치 스스로 척척”

이시간 핫뉴스

많이 본 기사