캐릭터로 AI 시각화한 SKT '에이닷'…능동적 대화 가능
네이버는 아바타 표정으로 비언어적 소통 가능한 AI 개발
구글, AI가 사용자 시선 인식…호출어 없이 대화할 수 있어
“카네이션 어때?”
“카네이션 말고 또 뭐가 있을까?”
“용돈박스도 괜찮을 것 같아”
인공지능(AI) 서비스가 빠르게 진화하고 있다. 예전에는 이용자의 질문에 대답하는 수준이었다면 친구처럼 대화하는 정도로 기술적 완성도가 높아졌다.
SK텔레콤이 16일 베타 버전으로 출시한 AI서비스 ‘에이닷’이 대표적이다. 에이닷은 캐릭터 설정을 통해 AI를 시각화한 앱이다. 단순히 정보를 설명해 주는 것에 그치지 않고 사용자와 대화를 이어가며 취향을 파악하고 그에 맞게 대응해 준다. 대화를 할수록 사용자를 더 잘 파악하게 돼 교감하며 관계를 형성하는 것이 가능해 진다.
에이닷은 스마트폰 앱을 통해 서비스한다. 최초 사용 시 관심사와 외모, 목소리, 말투, 이름 등을 설정해 본인만의 AI 캐릭터를 만들어야 한다. 특징은 수동적으로 대답만 하는 기존 서비스와는 달리 “아침 먹었어?”처럼 먼저 말을 건네는 등 능동적으로 사용자를 대한다는 점이다.
이를 위해 SK텔레콤은 거대언어모델(GPT-3)을 기반으로 한국어 특화 버전을 자체 개발했다. GPT-3은 마이크로소프트(MS)가 개발한 것으로 현존하는 대화 언어 모델 중 성능이 가장 뛰어난 것으로 평가된다.
또한 사용자 참여형 ‘큐피드’ 서비스를 통해 AI가 대답하지 못 하는 내용에 대해 다른 이용자가 대답해 준 내용을 기반으로 답변을 받도록 했다. 질문은 답변을 잘 할 것 같은 이에게 전달하기 때문에 보다 빠르고 정확하게 답을 얻을 수 있다는 게 SK텔레콤의 설명이다.
대화 중 원하는 콘텐츠를 이용하는 것도 가능하다. 동영상서비스 ‘웨이브’, 음원 서비스 ‘플로’, 내비게이션 ‘티맵’, T멤버십 등 SK그룹의 각종 앱들과 연동해 대화 중에도 해당 앱들을 자연스럽게 이용할 수 있다. 기존에는 앱 사용을 중단하고 원하는 앱을 실행시키는 방식이었다면 에이닷은 말로 해당 서비스들을 구동할 수 있다.
‘호출어’가 없다는 것도 기존 AI서비스와의 차이점이다. 대개 AI서비스를 부르는 호출어가 있어, 이를 사용해야만 대화가 됐다. 반면 에이닷은 호출어 대신 ‘마이크’ 또는 ‘문자 입력’ 버튼을 눌러서 대화를 해야 한다. 다소 번거로운 면이 있지만 일반적인 대화에서 상대의 이름을 매번 부르지 않는 것처럼 보다 자연스럽게 이야기 할 수 있도록 했다.
네이버도 자체 개발한 초거대 AI 하이퍼클로바를 기반으로 자유롭게 대화할 수 있는 ‘똑똑사전’ 기능을 AI스피커 클로바에 추가했다. 똑똑사전은 꼬리에 꼬리를 무는 연속적인 대화가 가능하다. “지구에서 가장 큰 공룡은 뭐야?”고 질문한 다음 이어서 “그럼 코끼리보다 얼마나 커?”라고 물어도 적절하게 답변해주는 식이다. 사용자가 몇 초간 응답이 없으면 “코끼리보다 작은 공룡을 알려드릴까요?”라며 이용자에게 질문을 하기도 한다. 다만 현재는 공룡, 우주, 반려동물을 주제로만 대화할 수 있다.
자연스러운 대화가 가능한 비결은 하이퍼클로바에 있다. 이는 네이버가 한국어에 최적화한 AI모델 구축을 위해 마련한 기술로 GPT-3보다 한국어 데이터를 6500배 이상 학습했다. 5600억 토큰(말뭉치)의 한국어 대용량 데이터를 구축했다. 이는 한국어 위키피디아의 2900배, 뉴스 50년치, 블로그 9년치에 달하는 규모다. 학습에는 3000억 토큰을 사용했다.
이에 더해 캐릭터와 대화하는 ‘아바타 챗봇’을 개발하고 있다. 대화의 맥락을 이해해 자연스럽게 대화하는 것은 물론 캐릭터가 표정을 나타내는 등의 비언어적 소통이 가능할 것으로 예상된다.
해외에서는 구글이 호출어 없이 AI서비스와 대화할 수 있는 기술을 선보였다. 구글은 최근 '구글 I/O 개발자 콘퍼런스 2022'에서 ‘오케이 구글’과 같은 호출어 없이 이용자 시선을 인식해 구글 어시스턴트를 구동시키는 기술 ‘룩앤톡(Look and Talk)’을 공개했다. 또 이용자의 목소리를 등록하면 반복적으로 명령하는 문구는 호출어 없이 이용할 수 있다.
룩앤톡은 구글이 자체 개발한 AI칩 ‘텐서(Tensor)’를 통해 구현했다. 구글은 일상 대화처럼 자연스러운 대화가 이뤄지기 위해서는 200ms(0.2초) 이내에 반응해야 한다고 보고 있다. 또 ‘음’과 같은 대화 멈춤 상황이 발생해도 이야기가 끊기지 않도록 뉘앙스를 이해하는 수준으로 구글 어시스턴드 기술을 계속 개선한다는 계획이다.
AI 서비스는 계속해서 진화할 전망이다. 이현아 SK텔레콤 AI&CO담당은 "PC에서 모바일 시대로 넘어왔고, 모바일 시대 다음은 AI서비스 시대가 될 것"이라며 "기존에는 목소리 중심이었다면 시각화된 AI, 그리고 대화라는 소통을 통해 친밀감을 주면서 애착관계를 형성하는 수준이 될 것"이라고 말했다.
◎공감언론 뉴시스 siming@newsis.com