사진 조작 공격에도 속지 않는 멀티모달 AI 기술 개발
다중 시각 분석 및 적응적 보정으로 AI 강인성 대폭 향상
AI 및 컴퓨터 비전 분야에서 가장 영향력이 큰 학회로 꼽히는 'CVPR 2026'은 오는 6월 3일부터 7일까지 미국 덴버에서 개최될 예정이다.
연구진은 이번 논문에서 대규모 비전–언어 모델(CLIP)이 사진을 교묘하게 조작하는 적대적 공격에 취약한 한계를 효과적으로 개선하는 새로운 방어 기법을 제안했다. 입력 이미지에 다양한 변형을 적용해 여러 시각의 이미지를 생성한 뒤, 연구진은 시각별로 추정된 손상 수준에 따라 반격 강도를 적응적으로 조절함으로써 모델의 예측을 보정하는 기법을 개발했다.
이를 통해 기존 기법들이 강한 공격 환경에서 성능이 급격히 저하되던 문제가 효과적으로 완화됐다. 개발된 기법은 총 20개 데이터셋 실험에서 세계 최고 수준의 적대적 강인성을 달성했으며, 추가 학습이나 파라미터 튜닝 없이도 빠른 추론 속도와 낮은 메모리 사용량을 동시에 유지하는 것으로 확인됐다.
한편 이번 연구는 단국대 연구진과의 공동연구로 수행됐으며 논문에는 김선오 단국대 교수가 제1저자, 엄 교수가 교신저자로 이름을 올렸다.
◎공감언론 뉴시스 xieunpark@newsis.com