해커 손에 쥐일라…앤스로픽, 최강 AI 봉인하고 제한판 출시

기사등록 2026/06/10 11:11:26

스로픽, 위험 낮춘 ‘클로드 페이블 5’ 공개

보안·생물학 등 민감 분야 답변 차단 강화

"해커 악용 막지만 방어 활용도 제한" 지적도

[뉴욕=AP/뉴시스] 2026년 2월26일 미국 뉴욕의 한 컴퓨터 화면에 미국 인공지능(AI) 기업 앤트로픽의 웹사이트 페이지와 기업 로고가 띄워져 있는 모습. 2026.06.02.
[서울=뉴시스] 박영환 기자 = 해킹에 악용될 수 있다는 이유로 공개가 미뤄졌던 인공지능(AI)이 안전장치를 대폭 강화해 공개된다. 다만 공격을 막기 위해 답변을 제한한 탓에, 기업과 보안 전문가가 네트워크 방어에 활용하기도 어려워질 수 있다는 지적이 나온다.

미국 뉴욕타임스(NYT)는 9일(현지시간) AI 기업 앤스로픽이 새 AI 시스템 ‘클로드 페이블 5’를 공개한다고 보도했다.

페이블 5는 앤스로픽이 지난 4월 선보인 ‘클로드 미토스’의 공개용 제한 모델이다. 앤스로픽은 당시 미토스가 컴퓨터 네트워크 침입을 노리는 해커들에게 강력한 도구가 될 수 있다며 일반 공개를 보류했다. 이 경고로 기업 임원들과 정부 당국자들 사이에 우려가 커졌다. AI가 사이버 공격 능력을 끌어올려 보안 위협을 한 단계 키울 수 있다는 불안이 확산했기 때문이다.

앤스로픽은 이번에 공개하는 페이블 5에 추가 안전장치를 적용했다. 사이버보안과 생물학처럼 악용 가능성이 큰 분야의 답변을 차단하도록 설계했다는 설명이다.

[서울=뉴시스] 이글루코퍼레이션 보안관제센터(SOC) 전경. (사진=이글루코퍼레이션 제공) 2026.05.11. photo@newsis.com *재판매 및 DB 금지
문제는 이 안전장치가 양날의 칼이 될 수 있다는 점이다. 해커들이 페이블 5를 이용해 네트워크를 공격하기는 어려워질 수 있지만, 기업이나 보안 전문가가 같은 시스템을 활용해 취약점을 찾아내고 네트워크를 방어하는 일도 제한될 수 있다.

앤스로픽은 위험하다고 판단되는 상당수 질문을 지난달 출시한 ‘클로드 오퍼스 4.8’로 넘겨 처리할 방침이다. 오퍼스 4.8은 미토스에서 제기된 보안 위험을 줄이도록 설계된 모델이라고 회사는 설명했다. 다이앤 펜 앤스로픽 제품관리 책임자는 “이것이 우리가 페이블을 공개할 수 있었던 핵심 이유”라고 말했다.

미토스는 여전히 제한된 기관에만 제공된다. 앤스로픽은 앞서 핵심 전산 인프라를 관리하는 약 40개 기관·기업에 미토스 초기 버전을 제공했다. 해커가 악용하기 전에 보안 취약점을 찾아 고치도록 하기 위한 조치였다.

보안 전문가들 사이에서는 앤스로픽의 제한 공개 방침을 두고 평가가 엇갈린다. 일부는 위험한 기술의 무분별한 확산을 막기 위한 책임 있는 결정이라고 본다. 반면 더 많은 연구자와 방어 전문가가 직접 시험하고 한계를 파악해야 한다며 공개 범위를 넓혀야 한다는 비판도 있다.

[샌프란시스코=AP/뉴시스]다리오 아모데이 앤트로픽 CEO가 지난 6일 샌프란시스코에서 열린 개발자 회의에서 발언하고 있다. 2026.5.8.
미토스에는 페이블 5에 적용된 안전장치가 적용되지 않았다. 외부 연구자들은 AI 시스템에 적용되는 안전장치가 항상 믿을 만큼 작동하는 것은 아니라고 지적해왔다. 앤스로픽 역시 이 문제를 인정하며 안전 연구를 계속하고 있다고 설명했다.
AI의 코드 작성 능력이 좋아질수록 보안 위협으로 악용될 가능성도 커진다. 소프트웨어 취약점을 찾아낼 수 있기 때문이다. 이 능력은 해커에게는 공격 수단이 되지만, 기업과 보안 전문가에게는 방어 수단이 될 수도 있다.

성능 면에서 페이블 5는 현재 일반에 공개된 AI 모델 가운데 최상위권으로 평가된다. AI 성능을 추적하는 발스AI의 벤치마크 테스트에 따르면 페이블 5의 종합 성능은 클로드 오퍼스 4.8보다 5% 높았다.

사용료는 오퍼스 4.8의 두 배 수준이다. 발스AI의 레이언 크리슈난 최고경영자(CEO)는 페이블 5가 특히 컴퓨터 코드 작성과 수학 분야에 강점을 보인다고 말했다. 다만 의료나 세금 평가 같은 일부 영역에서는 다른 AI 시스템이 더 나은 성능을 보였다고 설명했다.


◎공감언론 뉴시스 yunghp@newsis.com