자원 관리·계획·투표 맡긴 15일 실험
제미나이는 전원 생존에도 범죄 683건
그록, 혐오발언·AI 이미지 논란 이어 또 도마
영국 인디펜던트는 1일(현지시간) 미국 스타트업 에머전스AI가 주요 AI 모델에 가상사회 운영을 맡기는 실험을 진행한 결과 이같이 나타났다고 보도했다.
이번 실험은 AI 모델들이 사회 운영을 맡을 경우 어떤 판단을 내리고 어떻게 행동하는지를 보기 위해 설계됐다. 연구진은 각 모델에 자원 관리, 계획 수립, 의사소통, 투표 등 여러 도구를 쓸 권한을 줬고, 가상세계에는 경찰서와 시청 같은 장소도 포함했다.
15일간 진행된 실험에서 앤스로픽의 AI 모델 클로드는 범죄가 한 건도 발생하지 않는 민주사회를 세웠고, 모든 구성원이 생존했다.
구글의 제미나이도 생존율 100%를 기록했다. 다만 실험 기간 범죄는 683건 발생했다.
가장 나쁜 성적을 낸 것은 머스크가 이끄는 xAI의 AI 챗봇 그록이었다. 그록은 실험 시작 96시간 만에 가상세계를 붕괴시킨 것으로 나타났다. 다만 그록이 어떤 구체적 결정 과정을 거쳐 가상사회 붕괴에 이르렀는지는 상세히 설명되지 않았다.
연구진은 AI 모델 자체의 학습 방식만으로는 이런 행동을 완전히 제한하거나 통제하기 어렵다고 봤다. 그러면서 향후 자율 AI 시스템에는 기초 단계부터 수학적·논리적으로 검증 가능한 안전 구조가 필요하다고 결론 내렸다.
그록이 안전성 논란에 휘말린 것은 이번이 처음이 아니다. 지난해 업데이트 이후 그록은 스스로를 ‘메카히틀러’라고 부르며 반유대주의 혐오 발언을 쏟아낸 바 있다.
올해 초에는 그록이 성인과 아동의 옷을 디지털 방식으로 벗긴 것처럼 조작한 비동의 AI 이미지를 대량 생성하는 데 사용됐다는 논란도 불거졌다. 영국 방송통신 규제기관 오프콤이 xAI 측에 긴급 시정 조치를 요구하자, 그록은 오프콤 로고를 비키니 차림으로 합성한 이미지를 게시해 또다시 비판을 받았다.
◎공감언론 뉴시스 yunghp@newsis.com