"여러 버그들 연결해 침투 경로까지 짰다"…'미토스' 해킹 실력에 깜짝 놀란 협력사

기사등록 2026/05/20 11:40:38 최종수정 2026/05/20 13:42:24

클라우드플레어, 앤트로픽 신형 AI '클로드 미토스 프리뷰' 테스트 결과 공개

단순 버그 탐색 넘어 여러 취약점 연결해 시스템 제어권 탈취 시도

스스로 코드 수정하며 검증하는 수준…오탐률과 불안정한 안전장치는 한계

[서울=뉴시스]클라우드플레어가 앤트로픽의 보안 협의체 '프로젝트 글래스윙'에 참여해 AI 모델 '클로드 미토스 프리뷰'를 50여 개 자체 소프트웨어 저장소에 적용한 결과를 공개했다. 미토스 프리뷰에서 작동하는 개념 증명을 구축하는 것을 거부하는 예. (사진=클라우드플레어 제공) *재판매 및 DB 금지

[서울=뉴시스]심지혜 기자 = 앤트로픽의 고성능 인공지능(AI) 모델 '클로드 미토스'의 위력이 기대 이상으로 높았다는 평가가 나왔다. 단순한 소프트웨어(SW) 취약점 탐색 수준을 넘어 여러 개의 소규모 취약점을 엮어 실제 시스템을 공격할 수 있음이 증명됐다는 것.
 
글로벌 클라우드 기업 클라우드플레어는 20일 이 같은 테스트 결과를 발표했다. 이 기업은 앤트로픽의 보안 협의체인 '프로젝트 글래스윙'에 참여했다. 이후 신형 AI 모델인 '클로드 미토스 프리뷰'를 자사 SW 저장소 50여 곳에 적용해 성능을 검증했다.

그 결과 미토스 프리뷰는 기존 AI와 확연한 차이를 보였다는 설명이다. 기존 AI 모델들은 개별 SW의 버그나 보안 문제를 찾아내는 수준에 그쳤다. 반면 미토스 프리뷰는 각각 보면 위험도가 낮아 보이는 작은 취약점들을 서로 연결했다. 이를 통해 시스템 제어권을 통째로 빼앗는 공격을 수행했다.

쉽게 말해 기존 모델이 문에 작은 틈이 있다는 사실을 알려줬다면 미토스 프리뷰는 그 틈과 창문 잠금장치 내부 이동 경로를 함께 계산해 실제 침입 경로를 짜낸 셈이다.

미토스 프리뷰는 의심되는 버그가 실제로 악용될 수 있는지도 직접 확인했다. 일반적으로 보안 취약점을 찾는 것과 그 결함이 실제 시스템을 마비시키거나 제어권을 탈취하는 공격으로 이어질 수 있는지 증명하는 것은 완전히 다른 영역이다.

이 모델은 문제가 될 만한 코드를 직접 작성한 뒤 임시 가상 환경에서 실행해 성공 여부를 검증했다. 만약 실행에 실패하면 AI가 스스로 오류 원인을 파악했다. 가설을 다시 세우고 코드를 수정해 성공할 때까지 반복했다. 클라우드플레어는 이 과정이 일반적인 자동 점검 프로그램보다 숙련된 보안 연구원의 분석 방식에 가깝다고 평가했다.

다만, 한계점도 명확히 드러났다. 미토스 프리뷰는 일반 상용 모델처럼 일관된 안전장치가 부족했다. 특정 보안 요청을 거부하다가도, 주변 환경이나 질문 방식을 조금만 바꾸면 앞서 거부했던 취약점 분석을 그대로 수행하는 모습을 보였다. AI 내부에 안전장치가 있더라도 이것만으로는 완벽한 통제가 어렵다는 지적이다.

사람이 다시 확인해야 하는 오탐지 문제도 많았다. 특히 C나 C++처럼 메모리 보안이 취약한 프로그래밍 언어 환경에서 "문제가 있을 수 있다"는 식의 추정성 경고를 과도하게 쏟아냈다.

클라우드플레어는 숙련된 인간 연구자는 취약점을 발견했을 때 해당 위험도를 정확히 판단하지만 이 모델은 그러지 못했다. 버그를 찾으라는 지시를 받으면 실제 위험 여부와 상관없이 "이론상 가능하다"는 식의 모호한 결과를 계속해서 제시했다.
 
클라우드플레어는 미토스 프리뷰가 보안 AI의 큰 발전 가능성을 보여줬다고 결론 내렸다. 다만 당장 사람을 대체하기보다는 보안 담당자의 초기 탐색 작업을 돕는 보조 도구로 쓰는 것이 적합하다고 분석했다.


◎공감언론 뉴시스 siming@newsis.com