"통역사 이제 짐 싸야하나"…구글 AI, 내 목소리로 통역한다

기사등록 2025/08/21 15:07:22 최종수정 2025/08/21 18:46:23

구글, '픽셀 10' 주요 기능으로 통화 중 실시간 통역 소개

학습한 화자 음성으로 번역…자연스러운 대화 경험 제공

[서울=뉴시스]윤정민 기자 =

"안녕, 캐런? 제 말 들려요? (Hi, Karen, can you hear me? Does this work?)"

"(AI 통역) Hola, Karen, ¿puedes oirme? ¿Funciona esto?"

"와우, 저는 스페인어로 당신 말을 듣고 있는 미친 사람이에요. (I'm the crazy person listening to you in Spanish.)"


구글이 통화 중 실시간 통역 기능을 한층 더 개선했다. 인공지능(AI)이 각 화자 목소리, 어조 등을 학습해 마치 화자가 해당 언어를 말한 것처럼 통역해 준다.

구글은 20일(현지 시간) 미국 뉴욕에서 열린 '메이드 바이 구글' 행사에서 최신 스마트폰 '픽셀 10' 시리즈를 공개하고 통화 중 실시간 통역 기능을 선보였다.

실시간 통역은 이미 소비자들에게 익숙한 기능이다. 2023년 12월 SK텔레콤이 아이폰을 우선으로 에이닷 앱 내 통화 통역 기능을 선보였다. 지난해 1월 삼성전자도 갤럭시 S24 시리즈를 출시하며 해당 기능을 도입했다. 구글 미트, 줌, 마이크로소프트 팀즈 등 화상 회의 플랫폼에서도 실시간 통역 기능을 제공하고 있다.

지금까지 선보인 통역 기능은 번역 시 기계어가 말해주는 느낌이었다. 하지만 구글 AI는 마치 화자가 해당 언어로 말한 것처럼 전달해 자연스러운 대화를 느낄 수 있도록 했다.

구글은 자체 앱 프로세서(AP)인 '텐서 G5' 덕분이라고 설명했다. 텐서 G5는 TSMC의 최신 3㎚(나노미터) 공정으로 제조돼 전작 대비 중앙처리장치(CPU) 성능이 평균 34% 향상됐다. 텐서 처리 장치(TPU, 구글이 자체 개발한 특수 목적 프로세서)도 전작 대비 최대 60% 더 향상했다.

이를 통해 텐서 G5는 20개 이상의 온디바이스 AI 기능을 동시에 구현할 수 있을 정도로 성능이 강력해졌는데 몇 초간의 음성만으로 화자 음성을 재구성하는 '원샷 음성 보존' 능력도 갖추면서 실시간 음성 번역에 활용할 수 있게 됐다.

이날 행사에서 사회를 맡은 유명 방송인 지미 팰런은 구독자 912만명을 보유한 유튜브 스타 캐런 폴리네시아과 통화하며 영어와 스페인어를 동시 통역하는 모습을 보였다.

팰런이 영어로 "제 말 들려요, 잘 작동하나요?"라고 묻자 AI가 팰런 음성으로 스페인어를 통역하는 모습을 보였다. 실시간으로 화자 목소리, 어조를 학습해 번역하는 성능을 보이자 행사장 내 청중은 환호와 박수를 보냈다.

이 기능은 영어와 스페인어, 독일어, 일본어, 프랑스어, 힌디어, 이탈리아어, 포르투갈어, 스웨덴어, 러시아어, 인도네시아어를 서로 번역할 때 작동한다. 한국어는 제공하지 않는데 한국 시장에는 픽셀 10 시리즈를 출시하지 않기 때문에 탑재하지 않은 것으로 보인다.


◎공감언론 뉴시스 alpaca@newsis.com