애플·구글 모두 AI로 '음성비서' 진화 모색…AI 에이전트로 진화 시도
단순 명령 넘어 맥락 파악까지…음성 명령 만으로 복잡한 작업 수행

애플의 AI(인공지능) 비서 서비스 '시리'. (사진=애플) *재판매 및 DB 금지
[서울=뉴시스]윤현성 기자 = "지금 가는 길 근처에 평점 4점 이상인 식당 찾아줘. 가는 길에 전기차 급속 충전소도 들러야 하니까 경로에 추가해주고, 식당 도착 10분 전쯤에 친구한테 문자 좀 보내줘."
운전대를 잡은 채 내뱉은 한 마디에 인공지능(AI) 비서가 식당 예약부터 경로 최적화, 메시지 발송까지 일사천리로 끝낸다. 가까운 미래에는 '애플 시리'나 '구글 어시스턴트'가 이런 복잡한 명령까지 수행할 수 있는 진짜 음성 비서가 될 수 있을지 관심이 쏠리고 있다.
24일 관련업계에 따르면, 애플은 올 하반기 자사의 음성 비서 서비스 '시리'를 'AI 챗봇' 형태로 개편해나간다는 계획이다. 단순한 음성 인식 수준을 넘어 사용자의 의도와 맥락을 완벽히 이해하는 '에이전트' 중심의 AI 비서 경쟁이 본격화하고 있다.
그간 스마트폰 음성 비서는 "오늘 날씨 어때?"나 "오전 7시에 알람 맞춰줘" 같은 단순 명령에만 충실했다. 음성 명령이 조금만 어긋나도 "못 알아들었다"는 답변이 나오거나, 단순히 인터넷 링크만 툭 보여주는 경우도 적지 않았다.
하지만 곧 다가올 AI 음성비서의 변화는 한단계 대폭 진화할 것으로 기대된다. 애플의 경우 '애플 인텔리전스'를 통해 시리에 '화면 인식'과 '앱 간 동작' 능력을 부여할 예정이다. 이에 더해 시리를 챗GPT나 구글 제미나이처럼 'AI 챗봇'으로 개편하는 방안도 모색 중이다.
예컨대 사용자가 시리에게 "지난주 친구가 문자 메시지로 보내준 식당 정보 찾아서 이번 주 토요일 7시로 예약하고, 내 캘린더에 등록해줘"라고 명령하면 시리는 메시지 앱에서 식당 이름을 추출하고, 사파리로 예약 페이지를 확인한 뒤, 캘린더 앱에 일정을 기입하는 과정을 단 한 번의 명령으로 끝낼 수 있게 된다. 과거라면 사용자가 직접 메시지를 검색하고 앱을 넘나들며 수행해야 했던 번거로운 작업들이 AI의 판단 아래 자동화되는 셈이다.
구글 역시 기존 구글 어시스턴트를 멀티모달 능력을 갖춘 제미나이로 전환해나가겠다는 계획을 세운 상태다. 제미나이는 "이메일함에서 친구가 보내준 식당 추천 목록을 확인하고, 그중 채식 메뉴가 있는 곳을 골라 내 구글 지도에 저장해줘"라는 복잡한 요청을 수행할 수 있다.
제미나이는 단순한 검색 결과 나열이 아닌 이메일, 문서 등 사용자의 과거 데이터를 분석해 최적의 답안을 도출하는 '추론'의 영역으로 진입하고 있다는 평가까지 받고 있다.
운전대를 잡은 채 내뱉은 한 마디에 인공지능(AI) 비서가 식당 예약부터 경로 최적화, 메시지 발송까지 일사천리로 끝낸다. 가까운 미래에는 '애플 시리'나 '구글 어시스턴트'가 이런 복잡한 명령까지 수행할 수 있는 진짜 음성 비서가 될 수 있을지 관심이 쏠리고 있다.
24일 관련업계에 따르면, 애플은 올 하반기 자사의 음성 비서 서비스 '시리'를 'AI 챗봇' 형태로 개편해나간다는 계획이다. 단순한 음성 인식 수준을 넘어 사용자의 의도와 맥락을 완벽히 이해하는 '에이전트' 중심의 AI 비서 경쟁이 본격화하고 있다.
단순 명령만 듣던 애플 시리·구글 어시스턴트…대화 맥락까지 파악하는 '지능형 에이전트'로 진화
하지만 곧 다가올 AI 음성비서의 변화는 한단계 대폭 진화할 것으로 기대된다. 애플의 경우 '애플 인텔리전스'를 통해 시리에 '화면 인식'과 '앱 간 동작' 능력을 부여할 예정이다. 이에 더해 시리를 챗GPT나 구글 제미나이처럼 'AI 챗봇'으로 개편하는 방안도 모색 중이다.
예컨대 사용자가 시리에게 "지난주 친구가 문자 메시지로 보내준 식당 정보 찾아서 이번 주 토요일 7시로 예약하고, 내 캘린더에 등록해줘"라고 명령하면 시리는 메시지 앱에서 식당 이름을 추출하고, 사파리로 예약 페이지를 확인한 뒤, 캘린더 앱에 일정을 기입하는 과정을 단 한 번의 명령으로 끝낼 수 있게 된다. 과거라면 사용자가 직접 메시지를 검색하고 앱을 넘나들며 수행해야 했던 번거로운 작업들이 AI의 판단 아래 자동화되는 셈이다.
구글 역시 기존 구글 어시스턴트를 멀티모달 능력을 갖춘 제미나이로 전환해나가겠다는 계획을 세운 상태다. 제미나이는 "이메일함에서 친구가 보내준 식당 추천 목록을 확인하고, 그중 채식 메뉴가 있는 곳을 골라 내 구글 지도에 저장해줘"라는 복잡한 요청을 수행할 수 있다.
제미나이는 단순한 검색 결과 나열이 아닌 이메일, 문서 등 사용자의 과거 데이터를 분석해 최적의 답안을 도출하는 '추론'의 영역으로 진입하고 있다는 평가까지 받고 있다.
![[서울=뉴시스]구글의 AI(인공지능) 비서인 '구글 어시스턴트' 사용 예시. 음성 명령을 통해 타이머 설정, 정보 검색 등을 이용할 수 있다. (사진=구글 제공)](https://img1.newsis.com/2022/05/12/NISI20220512_0000995651_web.jpg?rnd=20220512162638)
[서울=뉴시스]구글의 AI(인공지능) 비서인 '구글 어시스턴트' 사용 예시. 음성 명령을 통해 타이머 설정, 정보 검색 등을 이용할 수 있다. (사진=구글 제공)
안드로이드 오토·애플 카플레이 환경도 바뀔까…운전 중 진가 발휘하는 '핸즈프리' 진화 기대
실제로 안드로이드 오토나 애플 카플레이 환경에서 비교적 단순한 음성 명령은 이미 가능한 상태다. 스마트폰과 차량을 연동한 뒤 전송 대상과 메시지 내용을 음성으로 명령하면 그대로 실행된다.
여기서 더 고도화된 AI는 수십 개의 밀린 메시지 중 핵심만 추려 운전자에게 브리핑하고, 상황에 맞는 자연스러운 답장까지 제안해 줄 수 있을 거으로 기대된다.
차량 관리와의 결합도 눈에 띈다. 가령 "지금 가는 길 근처에 평점 4점 이상인 식당 찾아주고, 가는 길에 전기차 급속 충전소도 들러야 하니까 경로에 추가해줘"라는 식의 연쇄 명령도 수행할 수 있을 전망이다. 운전자는 운전대에 손을 뗀 채 오직 목소리만으로 이동 경로와 식사, 차량 충전이라는 복합적인 스케줄을 실시간으로 조정할 수 있다.
고도화된 AI 비서, 인프라 비용 부담도 커진다…온디바이스·클라우드 '하이브리드' 필수
애플은 이를 '온디바이스 AI'와 '프라이빗 클라우드 컴퓨트(PCC)'의 결합으로 해소한다는 전략이다. 개인정보 보호가 중요하거나 가벼운 작업은 기기 내부에서 처리해 서버 부하를 줄이고, 고도의 연산이 필요한 경우에만 애플 실리콘 기반의 전용 서버를 활용한다.
특히 최근에는 자체 모델의 한계를 극복하고 비용 효율을 높이기 위해 구글의 제미나이를 시리에 이식하는 파트너십을 체결하고 인프라 공유를 통한 효율화를 꾀하고 있다.
AI 분야에서 가장 앞서고 있다는 평을 받는 구글은 전 세계에 구축된 자사 데이터센터와 AI 전용 칩(TPU) 인프라를 적극 활용 중이다. 동시에 스마트폰 내부에서 작동하는 경량 모델인 '제미나이 나노'를 통해 클라우드 의존도를 낮추는 방안도 마련했다. '제미나이 어드밴스드'와 같은 유료 구독 모델을 통해 고도화된 AI 서비스에 따른 비용을 수익으로 환전하는 비즈니스 모델도 안착시키고 있다.
업계에서는 향후 음성 비서가 사용자의 습관과 선호를 학습해 명령이 떨어지기 전에 먼저 제안하는 '능동형 AI'로 진화할 것으로 보고 있다. 스마트폰이 단순한 도구를 넘어 개인의 삶을 관리하는 진정한 '디지털 동반자'가 되는 시대가 머지않았다는 관측이다.
◎공감언론 뉴시스 [email protected]
