네이버 차세대 AI 검색 기능 'AI 탭' 3대 핵심 기술 공개
백과사전식 답변 넘었다…실시간 데이터로 예약·결제까지 척척
아는 척 대신 되묻는 기술 적용…AI 고질병 '거짓말' 30%p 줄여
![[서울=뉴시스] 2일 진행된 'AI검색 테크 딥톡' 현장에서 발표하는 네이버 이기창 이사. (사진=네이버 제공) *재판매 및 DB 금지](https://img1.newsis.com/2026/07/03/NISI20260703_0002177156_web.jpg?rnd=20260703095911)
[서울=뉴시스] 2일 진행된 'AI검색 테크 딥톡' 현장에서 발표하는 네이버 이기창 이사. (사진=네이버 제공) *재판매 및 DB 금지
[서울=뉴시스]이주영 기자 = #첫 데이트 장소를 찾던 A씨는 드라마 속 주인공이 머물던 카페 사진을 네이버 'AI 탭'에 올리고 "이런 분위기의 장소에서 데이트하고 싶은데 괜찮은 곳 찾아 줘"라고 입력했다. 과거의 AI라면 관련 없는 카페 목록을 나열하기 일쑤였다. 하지만 네이버 AI는 영상 속 인테리어와 조명, 가구 배치까지 파악하고 네이버 플레이스에 등록된 사진과 후기를 분석해 A씨가 찾던 카페를 추천했다.
#B씨는 갑자기 떠오른 영화배우의 이름이 생각나지 않아 AI 탭에 "그 영화 주연 누구였더라"라고 물었다. 네이버 AI는 모르는 정보는 섣불리 짐작해 엉뚱한 배우 이름을 늘어놓는 대신 "어떤 영화를 말씀하시는 건가요?"라고 되물었다. B씨는 그때야 "옛날 미국 배경으로 탁구 치던 사람이 나오는 영화야"라고 말하자, AI 탭은 "'마티 슈프림' 속 티모시 샬라메 배우를 말씀하시는군요"라고 답했다.
쏟아지는 범용 인공지능(AI) 사이에서 네이버가 '아는 척' 대신 '제대로 묻는' 전략을 택했다. 사용자가 원하는 바는 단순한 지식 나열이 아니라 예약과 구매까지 책임지는 '일머리 있는 에이전트'이기 때문이다.
네이버는 지난 2일 서울 강남구 네이버 D2SF 강남에서 차세대 AI 검색 기능 'AI 탭'의 개발 과정과 청사진을 공개했다.
네이버가 지난달 전체 사용자를 대상으로 공개한 AI탭은 대화형 검색 서비스다. 이 서비스의 핵심 기술은 '프로덕트 네이티브 거대언어모델(LLM)'이다. 기존 LLM이 백과사전을 읊는 지식인이었다면, 새 모델은 검색부터 예약, 결제까지 책임지는 비서에 가깝다. 블로그, 카페, 지도, 쇼핑 등 네이버만의 방대한 생태계에서 쌓여진 방대한 데이터와 서비스 자산이 AI의 활동 무대다.
이기창 네이버클라우드 이사는 이날 "우리의 목표는 모든 벤치마크에서 1등을 하는 모델을 만드는 것이 아니다"라며 "사용자가 식당을 찾고 예약을 하고 쇼핑을 하는 실제 서비스의 순간에 가장 정확하고 효율적으로 작동하는 모델을 만드는 것"이라고 강조했다.
속도는 2배 빨라지고…모르면 되묻는 '솔직한 AI'
AI의 고질적인 문제인 '그럴듯한 거짓말(환각 현상)'도 잡았다. 질문이 모호하면 아는 척하는 대신 되묻도록 학습시켰다. 예를 들어 사용자가 "그 드라마 주연이 누구야?"라고 물었을 때 아무 배우나 짐작해서 답하지 않고 "어떤 드라마를 말씀하시는 건가요?"라고 되묻는다. 실제로 지식과 환각을 측정하는 글로벌 벤치마크 테스트에서 기존 모델 대비 환각 비율이 최대 30%포인트 개선된 것으로 나타났다.
"회식장소? 주차? 네 알겠습니다"…찰떡같이 알아듣는 AI
모델 성능이 아무리 뛰어나도 이를 실제 서비스 환경에서 적절히 적용하지 못한다면 무용지물이다.
일반적인 AI는 과거에 학습한 데이터에 갇혀 있다. 하지만 네이버 AI는 최신 뉴스나 블로그, 지도 정보를 스스로 찾아 현재 시점의 정확한 답을 내놓는다. 과거 대화의 맥락도 끝까지 기억한다. 예를 들어 2026년 3월 학습된 AI에게 "최근 월드컵 개최지가 어디야?"라고 물으면 실시간 정보를 모르는 AI는 과거의 기록을 토대로 "카타르"라고 답할 수밖에 없다.
이때 하네스 엔지니어링이 개입한다. AI가 네이버 블로그, 뉴스, 지도, 쇼핑 등 실시간 데이터를 스스로 찾고 답변의 근거를 확인한 뒤 사용자에게 "캐나다, 멕시코, 미국"이라고 전달하도록 시스템을 짜는 것이다.
하네스 엔지니어링이 적용된 AI는 꼬리 물기 질문에도 척척 답한다. 긴 대화 맥락 속에서 사용자의 선호도를 파악하고 후속 질문도 던진다.
예를 들어 사용자가 "충무로 회식 장소 찾아 줘"라고 한 번만 말하면, 이후 "주차되는 곳으로"라고 짧게 물어도 AI는 앞선 대화 내용을 요약해 '주차 가능한 정자동 회식 장소'를 찾아낸다. 심지어 "오늘 저녁에 비 와?"라는 질문에는 날씨 정보와 함께 "회식에 무리가 있을 수 있으니 실내 장소를 확인해 보세요"라는 조언까지 덧붙인다.
네이버는 덩치가 큰 대형 모델 대신 가볍고 빠른 작은 언어모델(SLM)들을 조합해 이 기능을 구현했다. 한승균 네이버 AI 검색 서비스 리더는 "특화된 작은 모델들을 사용해 서비스 운영 비용을 3배 줄였고 속도는 2배 이상 높였다"고 설명했다.
![[서울=뉴시스] 2일 진행된 'AI검색 테크 딥톡' 현장에서 발표하는 네이버 한승균 리더. (사진=네이버 제공) *재판매 및 DB 금지](https://img1.newsis.com/2026/07/03/NISI20260703_0002177159_web.jpg?rnd=20260703095946)
[서울=뉴시스] 2일 진행된 'AI검색 테크 딥톡' 현장에서 발표하는 네이버 한승균 리더. (사진=네이버 제공) *재판매 및 DB 금지
글자 몰라도 사진 한 장이면 예약까지 완료
네이버는 검색창 전면에 '스마트렌즈'를 장착해 AI 비서의 시각 지능도 높였다. 가령, 사용자가 영상 속 카페를 보며 "이런 분위기로 저녁에 4명 예약해 줘"라고 말하면 AI가 영상 속 인테리어와 조명, 가구 배치를 파악한 뒤 유사한 식당을 찾아 실시간 예약까지 연결하는 방식이다.
윤상두 네이버 AI 센터 리더는 "시각 기술은 단순한 입력 수단이 아니라 에이전트가 세상을 인식하는 눈"이라며 "앞으로는 네이버 AI 비서는 텍스트가 아니라 이미지를 통해서도 사용자의 의도를 이해하고 실제 행동까지 연결하는 멀티모델 에이전트 방향으로 진화할 것"이라고 말했다.
이날 윤 리더는 지난달 미국 컴퓨터 비전 학회(CVPR)에서 발표한 '뮤코' 기술을 소개했다. 뮤코는 사용자가 사진을 보며 연속해서 질문을 던질 때 이미지를 처음부터 다시 처리하는 대신 대화 맥락을 유지하며 효율적으로 답을 찾아내는 기술이다. 3500만개의 멀티모달 데이터셋을 학습한 이 기술은 주요 글로벌 벤치마크에서 최고 수준의 성능을 입증했다.
![[서울=뉴시스] 2일 진행된 'AI검색 테크 딥톡' 현장에서 발표하는 네이버 윤상두 리더. (사진=네이버 제공) *재판매 및 DB 금지](https://img1.newsis.com/2026/07/03/NISI20260703_0002177160_web.jpg?rnd=20260703100011)
[서울=뉴시스] 2일 진행된 'AI검색 테크 딥톡' 현장에서 발표하는 네이버 윤상두 리더. (사진=네이버 제공) *재판매 및 DB 금지
