AWS 리인벤트서 영상 이해 모델 '마렝고 3.0' 공개
스토리지 비용 50% 절감·인덱싱 속도 2배 향상…즉각 효율 입증
'마렝고'와 '페가수스' AWS '아마존 베드록'에 공급

이재성 트웰브랩스 대표가 미국 라스베이거스에서 현지시각 12월 1일 개막한 '아마존웹서비스(AWS) 리인벤트 2025'에서 차세대 영상 AI 모델 '마렝고(Marengo)3.0'을 소개하고 있다(사진=송혜리 기자) *재판매 및 DB 금지
[미국 라스베이거스=뉴시스]송혜리 기자 = "전 세계 디지털 데이터의 90%가 영상인데 사람이 직접 분석하기에 너무 오래 걸리고, 기존 기술로는 모든 것을 파악하기가 어려워서 그동안 대부분 제대로 활용되지 못했습니다. 이 문제를 해결하는 것이 우리의 목표입니다."
이재성 트웰브랩스 대표는 미국 라스베이거스에서 현지시각 12월 1일 개막한 '아마존웹서비스(AWS) 리인벤트 2025'에서 차세대 영상 AI 모델 '마렝고(Marengo)3.0'을 공식 출시한다고 밝혔다. AWS 리인벤트는 AWS가 매년 미국에서 개최하는 세계 최대 규모의 클라우드 컴퓨팅 콘퍼런스다.
이번 행사를 통해 신제품을 공개한 트웰브랩스는 영상 속 정보를 이해하고 문장으로 검색할 수 있는 AI 기술을 만드는 스타트업으로 2021년 미국 샌프란시스코에서 설립됐다.
이 회사의 기술은 영상 속 사람·사물·행동을 자동으로 파악해 의미를 이해하는 데 강점이 있다. 주력 제품인 '마렝고'는 영상 속 장면이나 요소를 문장으로 검색할 수 있는 영상 검색 서비스이고, '페가수스(Pegasus)'는 영상 내용을 질문하면 답변을 제공하는 질의응답형 AI 모델이다.
이를 바탕으로 트웰브랩스는 글로벌 리서치기관 CB인사이트가 발표한 글로벌 100대 AI 스타트업 'AI100'에 선정되는 등 글로벌 시장에서 주목받고 있다.
실제 지난해 6월 엔비디아 자회사 엔벤처스와 뉴엔터프라이즈어소시에이트(NEA) 등으로부터 약 5000만달러(약 734억원) 규모 투자 유치에 성공하며 화제가 됐다. 뿐만 아니라 네이버도 전문 투자 법인 네이버 벤처스를 설립한 후 첫 투자처로 이 회사를 선택했으며, SK텔레콤도 300만달러(약 44억원)를 투자하고 기술 협력을 진행하고 있다.
국내외 투자 몰리는 멀티모달AI 개발사
이날 트웰브랩스가 선보인 신제품은 영상 속 장면의 텍스트·음성·움직임·상황 맥락을 통합적으로 이해하는 '차세대 비디오 파운데이션 모델(Video Foundation Model)'로, 회사가 지금까지 선보인 모델 중 가장 강력한 기능을 갖췄다.
업계 최초로 이미지와 텍스트를 동시에 검색할 수 있는 '복합 이미지 검색(Composed Image Retrieval)' 기능과 '사람'이나 '제품'을 별도로 등록해 찾아볼 수 있는 '고유명사 검색(Entity Search)' 기능이 적용됐다.
특히, 마렝고 3.0은 이미지·오디오 모델의 단순 조합으로 영상을 분석하는 기존의 방식에서 벗어나, 영상 이해를 위해 처음부터 설계된 '네이티브 파운데이션' 구조를 기반으로 영상 전체를 시간·공간적으로 해석하는 구조를 갖추고 있다. 이를 통해 장면 간 연속성과 맥락을 자연스럽게 파악한다.
이를 통해 마렝고 3.0은 영상 속 대사와 몇 분 후에 등장하는 동작을 연결해 해석하고 사물·행동·감정·상황 변화를 시간의 흐름에 따라 추적하는 등 인간에 가까운 수준의 영상 이해 능력을 구현한다는 게 회사 측 설명이다.
일례로 프로 스포츠 리그에서는 특정 선수의 득점 장면이나 결정적 플레이만을 즉시 검색해서 찾아내 하이라이트를 빠르게 제작할 수 있으며, 경기 분석의 효율을 크게 높일 수 있다. 방송·포스트 프로덕션 분야에서는 수십 년치 아카이브에서 특정 유명인의 얼굴을 '고유명사'로 등록해 원하는 행동을 하는 장면을 몇 초 만에 찾아낼 수 있다.
뿐만 아니라 공공보안 쪽에서는 폐쇄회로카메라(CCTV) 영상 전체를 몇시간씩 볼 필요 없이 빠르게 원하는 장면 만을 정확하게 찾아낼 수 있으며, 이커머스 분야에서도 브랜드, 제품, 혹은 호스트가 언제 등장하고 어떤 행동을 하고 있는지 원하는대로 즉시 검색해 볼 수 있다.
마렝고 3.0은 36개 언어를 지원해 글로벌 기업 환경에서도 안정적으로 활용할 수 있다. 아울러 수차례 정교한 테스트를 통해 스토리지 비용 50% 절감, 인덱싱 속도 2배 향상 등의 즉각적인 효율성 개선도 확인했다.
이재성 대표는 "마렝고 3.0은 그동안 영상 이해 기술이 가졌던 한계를 완전히 뛰어넘는 모델로, 기업과 개발자에게 기존과 다른 혁신적인 기준을 제시할 것"이라고 출시 소개했다.
영상 이해 AI로 AWS 베드록 진입
아마존 베드록은 AWS에서 제공하는 대규모 언어 모델(LLM) 개발 및 배포 플랫폼이다. 개발자와 기업이 손쉽게 생성형 AI 앱과 에이전트를 구축·운영할 수 있도록 지원하는 서비스다. 이를 통해 기업들은 아마존 베드록을 기반으로 인프라를 직접 관리하지 않고도, 트웰브랩스의 비디오 이해 모델을 활용해 자연어 기반 영상 검색, 장면 분류, 콘텐츠 요약 등 생성형 AI 애플리케이션을 구축하고 확장할 수 있다.
이재성 대표는 "클라우드 마이그레이션 2.0은 비디오로 확장될 것이라는 전망에 따라 AWS와도 그 방향에서 함께 열심히 협력하고 있다"면서 "아마존 베드록에 모델을 올린 지난 7월 이후, 그동안 저희 엔터프라이즈 모델을 활용해 개념검증(PoC)나 파일럿, 혹은 실제 프로덕션 단계까지 진행한 고객들을 모두 합치면 이미 3만 곳이 넘는 것 같다"고 말했다.
이어 "특히 엔터프라이즈 고객분들은 대부분 AWS를 깊게 활용하고 있기 때문에 데이터 보안과 안정성에 매우 민감하다"면서 "그런 점에서 베드록에 올라가 있는 트웰브랩스 모델은 고객이 기존 환경에서 그대로 사용할 수 있다는 장점이 있어 확실한 매리트를 느끼는 것 같다"고 설명했다.
◎공감언론 뉴시스 [email protected]
