오퍼스 4.7, GPT-5.4 깨고 압도적 1위…실제 해상도 3배↑·추론 세분화로 무장
앤트로픽 "미토스는 더 강력, 비공개 유지"
미토스 프리뷰는 "오퍼스 상회" 이례적 공개
[서울=뉴시스]오동현 기자 = 앤트로픽이 최신 플래그십 인공지능(AI) 모델 '클로드 오퍼스 4.7(Claude Opus 4.7)'을 16일(현지시간) 공개했다.
지난 2월 전작인 오퍼스 4.6을 선보인 지 약 2개월 만의 업그레이드로, 코딩·에이전트·시각 인식 전반에서 성능이 향상된 반면 가격은 동결됐다.
앤트로픽은 이날 공식 블로그를 통해 "오퍼스 4.7은 고급 소프트웨어 엔지니어링에서 오퍼스 4.6 대비 눈에 띄는 개선을 이뤘으며, 특히 가장 어려운 과제에서 두드러진 성과를 보였다"고 밝혔다.
◆코딩 성능 대폭 향상…SWE-벤치 87.6%로 전작 앞서
가장 큰 변화는 코딩 능력이다. 실제 오픈소스 저장소의 버그 수정 능력을 평가하는 'SWE-벤치 베리파이드(Verified)'에서 오퍼스 4.7은 87.6%를 기록했다. 전작 오퍼스 4.6의 80.8% 대비 6.8%포인트 상승한 수치다. 난이도가 더 높은 'SWE-벤치 프로(Pro)'에서는 64.3%를 기록해 오픈AI의 GPT-5.4(57.7%), 구글 제미나이 3.1 프로(54.2%)를 앞섰다.
파트너사 실증 결과도 공개됐다. 일본 라쿠텐의 자체 벤치마크 '라쿠텐-SWE-벤치'에서 오퍼스 4.7은 오퍼스 4.6 대비 약 3배 많은 프로덕션 과제를 해결했으며, 코드 품질과 테스트 품질에서 두 자릿수 개선을 보였다고 앤트로픽은 전했다.
도구 활용 능력도 강화됐다. MCP-아틀라스 벤치마크에서 77.3%를 기록해 GPT-5.4(68.1%), 제미나이 3.1 프로(73.9%)를 앞섰다. 컴퓨터 조작 능력을 측정하는 OSWorld-베리파이드에서는 78.0%로 전작(72.7%) 대비 5.3%포인트 올랐다.
◆시각 인식 해상도 3배↑…'엑스하이' 추론 단계 신설
멀티모달 성능도 강화됐다. 오퍼스 4.7은 긴 변 기준 최대 2576픽셀(약 3.75메가픽셀) 이미지를 처리할 수 있다. 이전 클로드 모델보다 3배 이상 높은 해상도다. 덕분에 차트 해독 벤치마크 'CharXiv-R'(도구 미사용) 점수가 68.7%에서 82.1%로 크게 올랐다.
앤트로픽은 "스크린샷, 기술 다이어그램, 디자인 시안, 문서 등을 실제 해상도 그대로 처리할 수 있게 됐다"고 설명했다.
추론 제어 옵션도 세분화됐다. 기존 '로우(low)-미디엄(medium)-하이(high)-맥스(max)' 단계 사이에 '엑스하이(xhigh)'가 추가됐다. 하이와 맥스 사이의 중간 단계로, 추론 깊이와 응답 지연 시간 사이에서 더 정밀하게 균형을 맞출 수 있도록 설계됐다.
코딩 도구 '클로드 코드(Claude Code)'는 모든 요금제에서 기본 추론 수준이 엑스하이로 상향됐다.
◆가격 동결…"더 강력한 미토스는 비공개 유지"
가격은 입력 토큰 100만개당 5달러, 출력 토큰 100만개당 25달러로 전작과 동일하다. 프롬프트 캐싱 시 최대 90%, 배치 처리 시 50% 비용 절감이 가능하다. 컨텍스트 윈도우는 100만 토큰을 유지했다.
다만 주의할 점도 있다. 앤트로픽은 "오퍼스 4.7은 업데이트된 토크나이저를 사용해 같은 입력이 콘텐츠 유형에 따라 약 1.0~1.35배 더 많은 토큰으로 매핑될 수 있으며, 높은 추론 단계에서는 더 많이 사고하기 때문에 출력 토큰도 증가한다"고 안내했다.
한편 앤트로픽은 이번 발표에서 자사가 보유한 더 강력한 모델 '클로드 미토스 프리뷰(Mythos Preview)'가 오퍼스 4.7을 상회한다는 점을 이례적으로 공개했다. 미토스는 사이버 보안 이니셔티브 '프로젝트 글래스윙(Project Glasswing)'의 일환으로 일부 기업에만 제한적으로 제공된다.
앤트로픽은 오퍼스 4.7의 사이버 공격 관련 역량이 미토스 프리뷰 수준에는 미치지 못한다는 점도 분명히 했다. 회사 측은 "훈련 과정에서 해당 역량을 의도적으로 축소하는 실험을 병행했다"고 설명했다.
특히 앤트로픽은 "오퍼스 4.7은 사이버 보안 관련 금지·고위험 요청을 자동 탐지·차단하는 안전장치를 탑재해 출시됐다"며 "이번 실제 배포에서 얻는 학습을 바탕으로 향후 미토스급 모델의 광범위한 공개를 준비할 것"이라고 밝혔다.
이와 함께 앤트로픽은 오퍼스 4.7을 취약점 연구, 침투 테스트, 레드 티밍 등 합법적 보안 목적으로 활용하려는 전문가를 대상으로 한 '사이버 검증 프로그램(Cyber Verification Program)'을 신설했다.
◎공감언론 뉴시스 odong85@newsis.com