구글 "온 세상에 자막 다는 방법"이라더니
실시간 AR 번역 서비스 '한글 오역'
구글 자동번역, 한글 언어유희 이해 역부족
"번역 품질 높이려면 사람이 채워가는 데이터 필요"
어느 한국 음식점에서 판매하는 '육회한 연어'라는 메뉴를 단순히 'raw salmon'으로 오역한 것이다. 해당 음식점이 '육회와 연어 세트' 메뉴를 언어유희 차원에서 '육회한 연어'로 표현한 것을 구글 글라스가 '육회'를 빠뜨리고 '생연어'로만 번역했다.
구글의 인공지능 번역 서비스가 한국어를 이해했다면 'korean style raw beef and raw salmon'으로 번역했어야 맞다. 아직은 사람의 손길이 필요하다는 방증이기도 했다.
이 해프닝은 구글이 지난 11일(현지시간) 미국 캘리포니아 샌프란시스코에서 개최한 자사 연례 개발자 콘퍼런스 '구글 I/O 2022' 행사를 통해 전 세계 온라인 중계됐다.
31일 정보기술(IT) 업계에 따르면, 구글이 개발 중인 AR 글라스(증강현실 안경)는 착용한 사람이 외국어 메뉴판을 바라보면 번역된 언어로 메뉴판이 보이고, 대화 시에도 상대방의 말이 안경 옆에 번역된 텍스트로 표시된다. 이를 두고 구글의 제품 매니저 맥스 스피어는 "온 세상에 자막을 다는 일"이라 표현한다.
이번 행사에서 구글은 '구글 글라스'를 다시 일상으로 가져올 계획을 제시해 주목받았다. '구글 글라스'는 2013년 일반 소비자를 겨냥해 출시됐지만, 비싼 가격과 내장된 카메라로 인한 사생활 침해 문제 등으로 판매가 중단됐고 제조·물류·의료 등 산업 현장에서만 사용돼 왔다.
특히 구글의 번역 품질 자체도 아직 미완성 단계다. 구글이 서비스하는 '구글 렌즈'로 한 횟집 메뉴판을 번역해보면 "나 싱싱해요"라는 문구를 "I m imaging it"으로 오역한다. '구글 렌즈'는 안드로이드 스마트폰 카메라로 텍스트를 촬영하면 원하는 언어로 번역해주는 서비스다.
구글의 사례처럼 아직 인공지능 자동 번역 서비스는 아직 사람들의 기대치를 온전히 만족시키지 못하고 있다. 이 때문에 구글이나 네이버, 카카오, 플리토 등 많은 인공지능 번역 서비스 업체들이 고품질의 언어 데이터를 확보하는 데 투자하고 있다.
언어는 살아있는 생물처럼 끊임없이 변화하기 때문에 자동번역 결과의 완성도를 높이기 위해서는 다량의 언어 데이터가 끊임없이 공급돼야 한다. 이 과정에서 실제 번역가들이 직접 만들어내고 검수하는 양질의 말뭉치(corpus) 데이터도 지속해서 필요하다.
최근에는 플리토 내 '메뉴 번역 서비스' 서비스도 선보였다. 식당을 운영하는 점주가 메뉴판을 사진 찍어 메뉴 번역 앱에 등록하기만 하면, 플리토에서 8개 언어로(한국어, 영어, 일본어, 중국어 간체자, 중국어 번체자, 프랑스어, 스페인어, 아랍어) 번역된 메뉴판 페이지를 제공한다. 손님은 QR를 스캔하면 번역된 메뉴판을 확인하고 쉽게 주문할 수 있다. 또 각 메뉴를 클릭하면 해당 메뉴와 관련된 이미지와 상세 설명도 확인할 수 있다.
플리토 관계자는 "예전에는 번역기를 이용해 점주가 직접 메뉴판을 번역해 왔고, 이 경우 해당 언어에 대한 지식이 없는 상태에서 전적으로 번역기의 결과에 의존하다 보니 '육회 = Six Times'와 같은 실소를 자아낼만한 번역 결과가 나오기도 했다. 또 이를 검수할 수도 없다는 문제점이 있었다"며 "이제는 플리토의 전문 검수를 거친 완벽한 다국어 번역 서비스를 제공받을 수 있다"고 전했다.
또 "메뉴 번역 서비스는 단순히 정확한 번역 결과를 제공하는 것에 그치지 않는다. 인공지능 번역 결과의 오역 사례를 수집하고, 사례 분석 및 검수를 통해 데이터를 가공한다. 또 이를 인공지능에 학습시켜 번역 성능을 향상시키는 데 사용된다"고 설명했다.
◎공감언론 뉴시스 odong85@newsis.com