회의·의료·교육·돌봄까지 다양한 영역에서 활약
[서울=뉴시스]권안나 기자 = 최근 '오픈AI'가 개발한 인공지능(AI) 대화형 메신저 '챗GPT'의 등장으로 AI에 대한 관심이 뜨겁다. 특히 챗GPT가 언어에 특화된 모델인 만큼, 다양한 영역에서 활약하고 있는 AI 음성인식 솔루션 기술도 덩달아 주목받고 있다.
23일 관련 업계에 따르면 회의·의료현장·교육·돌봄 케어까지 분야별 특정 데이터를 학습해 고도화된 AI 음성인식 서비스들이 눈길을 끈다.
리턴제로는 음성인식 서비스 운영을 위해 텍스트 변환 기술(STT) 기반의 '소머즈 엔진'과 목소리를 분석해 화자를 분리해주는 '모세 엔진'을 자체 개발했다. 두 엔진을 기반으로 운영중인 AI 전화 '비토'에 이어 회의 기록 서비스 '콜라보'에도 이를 적용했다.
현재 클로즈 시범 테스트를 진행중인 콜라보는 20여개 기업에 도입됐다. 외부 소음에 노출된 환경에서도 발언자의 뚜렷한 음성 구분이 가능해 다수가 참석하는 회의에서도 작은 목소리까지 찾아내는 것이 특징이다.
구글 캘린더에 연동된 회의가 시작되면 AI봇이 자동으로 참여해 회의 내용을 영상으로 기록해준다. 회의 직후 녹화된 영상과 변환된 텍스트를 한눈에 확인할 수 있다.
리턴제로는 부정확한 발음과 구어체, 사투리 등으로 음성인식이 어려운 한국어 자유발화 환경에 특화된 음성인식, 화자분리 엔진을 자체적으로 구축하고 지속적인 연구를 통해 기술 경쟁력을 높이고 있다.
의료 업계에서도 스마트병원 구축 솔루션에 주목하며 AI 음성인식 엔진 도입 사례가 등장하고 있다.
정보통신산업진흥원 주관 AI바우처 지원사업을 통해 개발된 '간호 보이스 리포트(Voice Report)' 애플리케이션(앱)은 인텔로이드의 음성인식 엔진을 탑재한 간호 의무기록 자동화, 음성기록 솔루션이다.
간호사가 현장에서 처방 및 처치 내용을 실시간으로 기록할 수 있도록 도와 수기로 기록하는 시간을 단축시켰다. 간호사가 단순 업무보다 환자에게 집중할 수 있는 시간을 늘려 보다 쾌적한 진료환경을 조성할 수 있게 돕는다.
앱을 통해 기록된 내용은 PC에서도 연동해 바로 확인할 수 있어 보고서 작성, 차트 반영 등에 용이하다.
영어 회화 교육에 특화된 AI 튜터도 등장했다. 에듀테크 스타트업 스픽이지랩스는 음성인식 기반 영어 학습 앱 '스픽'을 운영하고 있다.
스픽이 자체 개발한 음성인식 AI 엔진은 짧은 시간 안에 사용자의 음성을 인식할 수 있다. 온라인 강의나 학원 대비 최대 10배 많은 영어회화 연습량을 제공한다.
스픽은 최근 원어민 없이 프리토킹이 가능한 AI 튜터도 출시했다. AI 튜터는 상황, 맥락, 분위기를 파악해 실제 원어민과 같은 대화를 구사하며 호텔 체크인, 지인과 약속 잡는 상황 등 이용자에게 필요한 역할과 상황을 설정할 수 있다.
스픽 AI 튜터는 영어와 한국어를 모두 인식하기 때문에 영어가 막힐 때는 한국어로 대화를 이어갈 수도 있다. 실시간 문장 교정 시스템으로 자연스러운 문장 표현이 가능하도록 돕고 학습의 완성도를 높인다.
돌봄 분야에서는 원더풀플랫폼이 출시한 AI 돌봄 로봇 '다솜이'가 노인맞춤돌봄서비스와 독거노인 응급안전안심서비스 등을 지원하고 있다.
다솜이는 어르신과의 간단한 대화부터 보호자와의 영상통화, 복약 및 식사 시간 알림, 긴급상황 알림 등 돌봄 케어 서비스를 제공한다. 독거 노인을 위한 음성·문자 메시지, 뉴스, 음악, 영상체조 등 다양한 콘텐츠도 제공한다.
감성 케어, 우울증 해소를 위한 말벗 기능, 랜덤 커뮤니티 대화가 가능한 챗봇도 탑재돼 정서적 교감과 소통이 가능하다. 취약계층의 우울증 해소, 치매 예방과 노인 자살률 감소 효과도 기대된다.
24시간 어르신의 움직임과 안면을 인식해주는 내장 카메라로 긴급 상황 발생 시 지차체 생활지원사나 관제센터 응급콜을 보낼 수 있다. 라이프 로그 데이터를 수집 및 분석 기능으로 예방 차원의 관리도 가능하다.
◎공감언론 뉴시스 [email protected]