[서울=뉴시스]신재우 기자 = 국립국어원이 '한국어-외국어 병렬 말뭉치 구축의 쟁점과 활용 방안’을 주제로 워크숍을 오는 14일 개최한다.
2022년 한국어-외국어 병렬 말뭉치 구축 사업단이 주최한다. 국어원이 구축하고 있는 병렬 말뭉치의 활용 방안 및 기대 효과에 대한 전문가의 특별 강연과 구축 과정에서 발생하는 주요 쟁점에 대한 토론이 이뤄진다. 서울 코지모임공간 강남역 2호점과 유튜브에서 온·오프라인으로 동시에 진행될 예정이다.
국립국어원은 "한국어-외국어 병렬 말뭉치가 향후 관련 기술 연구와 산업에 미칠 영향을 전망하고, 말뭉치 번역 과정에서 발생하는 다양한 상황에 대해 작업자들이 서로의 경험과 생각을 나눔으로써 발전적 병렬 말뭉치 자원 구축과 활용 방향을 점검할 좋은 기회가 될 것"이라고 밝혔다.
국립국어원은 지난 2021년 8월부터 한국과 정치·경제·문화 교류가 활발하지만 기구축 언어 자원이 부족한 8개 언어를 대상으로 한국어-외국어 병렬 말뭉치 구축 사업을 추진해 왔다. 최근 한국 문화 콘텐츠의 글로벌 확산으로 한국어 교육 및 자동 통·번역 기술 개발을 위한 언어 자원 수요가 증가했지만 태국어, 베트남어 등 외국어의 경우 확보된 언어 자원이 매우 부족했기 때문이다.
한국어를 8개 언어로 번역한 병렬 말뭉치는 언어 자원의 불균형을 해소하고 관련 산업의 부가 가치를 높이는 데 이용된다. 대상 언어는 태국어, 베트남어, 인도네시아어, 캄보디아 크메르어, 필리핀 타갈로그어, 인도 힌디어, 러시아어, 우즈베크어 등 8개다.
2021년 1차 사업에서 약 800만 어절의 병렬 말뭉치 구축을 완료한 국어원은 지난해 이후 1000만 어절 규모로 말뭉치를 확대해 구축하고 있다. 1차 사업으로 구축한 병렬 말뭉치는 '모두의 말뭉치' 홈페이지를 통해 올해 상반기 공개될 예정이다.
◎공감언론 뉴시스 shin2roo@newsis.com