카카오, '카나나' AI 모델 10종 공개…"비용 효율적인 LLM"

기사등록 2024/10/23 11:34:09 최종수정 2024/10/23 16:34:23

김병학 카나나알파 리더, 이프카카오서 AI 모델 공개

LLM 3종·MLLM 3종·비주얼 생성 2종·음성 2종 등 10종

"한국어와 처리에 있어 탁월한 고성능 보유"

[서울=뉴시스] 김병학 카카오 카나나알파 성과리더는 23일 오전 경기 용인시에서 열린 개발자 콘퍼런스 '이프카카오(if kakaoAI 2024)'에서 카나나 AI 모델을 소개했다. 사진은 카나나 AI 모델 (사진=카카오 제공) *재판매 및 DB 금지

[서울=뉴시스]윤정민 기자 = 카카오가 새 인공지능(AI) 브랜드 '카나나'를 공개한 가운데 이 브랜드를 이름으로 한 거대언어모델(LLM) 3종과 멀티모달 언어모델(MLLM) 3종, 비주얼 생성모델 2종, 음성모델 2종 등 AI 모델 10종을 공개했다.

김병학 카카오 카나나알파 성과리더는 23일 오전 경기 용인시에서 열린 개발자 콘퍼런스 '이프카카오(if kakaoAI 2024)'에서 카나나 AI 모델을 소개했다.

LLM 3종은 크기에 따라 초거대 크기의 '카나나 플래그', 중소형 크기의 '카나나 에센스', 초경량 크기의 '카나나 나노'로 나뉜다.

김 성과리더는 중소형 크기의 AI 모델인 '카나나 에센스'에 대해 정제된 데이터 학습과 최적화된 모델 크기로 탁월한 성능과 비용 효율성을 보여준다고 말했다. 저작권이나 개인정보 이슈가 해소된 고품질 데이터를 기반으로 필터링과 데이터 큐레이션 등의 전처리 작업을 진행했으며 독자적 고품질 데이터셋을 구축했다고 전했다.
[서울=뉴시스] 김병학 카카오 카나나알파 성과리더는 23일 오전 경기 용인시에서 열린 개발자 콘퍼런스 '이프카카오(if kakaoAI 2024)'에서 카나나 AI 모델을 소개했다. 사진은 카나나 에센스 성능 평가 비교표 (사진=카카오 제공) *재판매 및 DB 금지


김 성과리더는 카나나 에센스가 글로벌 최고 성능을 가진 유사 사이즈 대표 모델과의 성능 비교에서 유사하거나 높은 성능을 보였다고 말했다. 특히 한국어 논리 및 추론을 평가하는 KMMLU, HAE-RAE 벤치마크에서 우위를 보였다고 강조했다. 카나나 나노에 대해서도 유사 사이즈의 글로벌 대표 모델들과 비교했을 때 전반적인 벤치마크에서 평균적으로 탁월한 성능을 보였다고 전했다.

MLLM 3종은 통합 버전의 '카나나-오(o)', 이미지·비디오 중심의 '카나나-브이(v)', 오디오 중심의 '카나나-에이(a)'로 나뉜다. 김 성과리더는 이날 행사에서 카나나-오를 중심으로 MLLM을 소개했다.

카나나-오는 음성인식, 텍스트, 음성합성 등의 모델을 각각 필요에 따라 모듈식으로 결합해 사용했던 기존 구조에서 벗어나 여러 모달리티 데이터를 통합적으로 처리하는 형태로 개발됐다. 다양한 형태의 데이터를 동시에 이해해 빠르게 결과를 생성하는 구조를 갖춰 텍스트와 오디오를 함께 생성하며 어떤 질문을 하던 평균 1.6초의 속도로 빠른 답변을 출력해 준다고 전했다.

김 성과리더는 이미지 이해 성능 평가 시 자체 구축한 한국어와 한국 문화에 특화된 한국형 벤치마크에서 글로벌 모델 대비 높은 성능을 기록했다고 말했다. 특히 음성 성능 평가에서는 근소한 성능 우위를, SQA 벤치마크에서는 월등히 높은 정확도를 보였다고 강조했다.

비주얼 생성 모델 2종은 이미지 중심의 '칼리지(KOLLAGE)'와 동영상 중심의 '키네마(KINEMA)'로 나뉜다. 김 성과리더는 텍스트 입력부터 이미지 그리고 개인 프로필 사진까지 다양한 입력을 처리하는 형태로 개발 중이라고 밝혔다. 입력된 이미지를 영상으로 생성하는 것을 넘어 간단한 마우스 조작만으로 카메라와 캐릭터 움직임을 쉽게 제어할 수 있게 될 것이라고 전했다.

김 성과리더는 이들 모델 특징으로 한국어와 처리에 있어 탁월한 고성능을 보유했다는 점과 신뢰할 수 있는 데이터로 학습해 투명성을 갖췄다는 점, 서비스 최적화에 맞춘 비용 효율적인 모델이라고 강조했다.

그는 "서비스에 최적화된 LLM은 좋은 성능, 비용 효율성, 튜닝을 통해 서비스의 문제를 해결하는 능력을 갖춰야 한다"며 "카나나 모델을 기반으로 이용자들에게 직접적인 도움을 줄 수 있는 AI 서비스화를 앞두고 있다"고 밝혔다.


◎공감언론 뉴시스 alpaca@newsis.com