LG전자·오픈마인드와 협력 첫 결실…'피지컬 AI 세이프티'
AI 영상을 로봇 모션으로 자동 변환…'비디오투로봇'
비싼 로봇 파손 우려 해결…영상으로 '사고 예방' 배우는 로봇
[서울=뉴시스]오동현 기자 = 비싼 로봇을 직접 넘어뜨리지 않고도 '실패'를 가르친다.
인공지능(AI) 안전 스타트업 에임인텔리전스가 LG전자·오픈마인드와 협력한 첫 성과로 영상 속 인간의 동작을 로봇 데이터로 변환하는 'Video2Robot(비디오투로봇)' 파이프라인을 선보였다.
26일 에임인텔리전스에 따르면, '비디오투로봇'은 영상 속 인간의 동작을 로봇 학습 데이터로 변환하는 엔진이다. 고가의 장비 파손 우려 없이도 추락·충돌 등 고위험 시나리오를 AI로 사전 학습시키는 이 기술은 공개 직후 글로벌 테크 업계의 폭발적인 호응을 얻고 있다.
에임인텔리전스가 LG전자 및 미국 로봇 운영체제(OS) 기업 오픈마인드와 추진 중인 '피지컬 AI 세이프티' 협력의 첫 성과다. 3사는 로봇이 실제 환경에서 겪을 수 있는 위험을 시뮬레이션 단계에서 검증해 안전성을 구조적으로 높이는 것을 목표로 협력하고 있다.
이번에 선보인 '비디오투로봇'은 ▲인간과 근접 상호작용 ▲급경사 미끄러짐 ▲고하중 물체 조작 시의 균형 붕괴 등 현실에서 직접 연출하기 어려운 시나리오를 비오·소라 등 생성형 AI를 활용해 로봇 모션 데이터로 안전하게 변환한다. 이를 통해 로봇 안전 문제를 사후 대응이 아닌, '사전 학습'의 영역으로 끌어올렸다는 평가다.
기존에는 로봇 학습 과정에서 낙상·충돌 등 위험한 시나리오의 데이터를 수집하는 데 한계가 있었다. 고가의 장비 파손 우려와 안전 문제로 인해 실제 환경에서의 반복 촬영이 불가능했기 때문이다. 하지만 '비디오투로봇'을 활용하면 넘어지고 부딪히는 데이터를 직접 찍지 않고도 얻어낼 수 있다.
이 기술이 공개되자 글로벌 테크 커뮤니티는 즉각 반응했다. 지난 23일 기준 X(옛 트위터)와 링크드인 합산 조회수는 20만 회를 돌파했고, 개발자들의 성지라 불리는 깃허브(GitHub)에서도 높은 관심을 받았다. 단순 기술 데모를 넘어 로봇에게 실패를 가르치는 등 피지컬 AI 안전에 대한 업계의 공감대를 형성했다는 평가다.
에임인텔리전스는 그동안 텍스트·오디오·비디오 등 멀티모달(Multimodal) AI 안전 연구를 수행해 왔다. '비디오투로봇'은 축적된 멀티모달 연구 역량을 가상 공간이 아닌 물리적 세계의 안전 문제로 확장했다는 점에서 의미가 크다는 설명이다. 에임인텔리전스는 로봇이 현실 세계에서 안전하게 작동할 수 있도록 학습 구조 단계부터 안전성을 설계하는 것을 목표로 하고 있다.
권태윤 에임인텔리전스 연구원은 "비디오투로봇은 단순한 도구가 아닌 피지컬 AI 세이프티를 향한 첫걸음"이라며 "앞으로 로봇이 실제 환경에서 마주할 다양한 돌발 상황을 선제적으로 학습하고 대비하는 '피지컬 AI 세이프티 프레임워크'를 구축해 나갈 것"이라고 밝혔다.
◎공감언론 뉴시스 odong85@newsis.com