"과거와 달리 AI는 기업 간 협업 중요…자체 언어모델 개발 책임감"
카카오, MLLM 허니비 공개…이미지+텍스트로 답변하는 AI 모델
[서울=뉴시스]윤현성 기자 = 정신아 카카오 대표 내정자가 기업들 간 각개전투가 이뤄졌던 과거 기술 경쟁들과 달리 인공지능(AI)은 기업 간 협업과 생태계의 발현이 무엇보다 중요하다고 전망했다. 카카오가 개발한 멀티모달 언어모델(MLLM) '허니비'에 대해서도 처음으로 소개했다.
정 내정자는 19일 서울 여의도 전경련 회관에서 열린 '제5차 AI 최고위 전략대화'에 참석해 "과거 모바일 시대의 흐름에서는 기업들이 각자 열심히 개발하면 승자가 나왔지만, AI는 기업 간 협업과 생태계의 발현이 중요하다. 정부도 함께 정책을 마련해주시면 좋겠다"고 밝혔다.
그는 "카카오의 AI 방향은 여전히 고민 중이지만 사용자들의 일상생활에 스며들게 하는 방법이 뭘까 질문하고 해답을 찾아가려고 노력 중"이라며 "2022년 오픈 AI 열풍 이후 우리 자체 언어모델을 개발해야 한다는 책임감도 느꼈다. 네이버도 이런 책임감으로 같이 개발하는 것이라고 생각한다"고 말했다.
정 내정자는 AI를 이루는 핵심 요소로 파운데이션 모델, 트레이닝용 데이터, 인프라 등 3가지를 꼽았다.
그는 "파운데이션 모델 관점에서는 '코GPT'를 내부에서 열심히 개발중이고, 작년 7월엔 이미지 생성 모델인 '칼로'를 출시하기도 했다"며 "더 나아가서 오늘은 MLLM을 공개했다. 조만간 쓸 수 있을 것이라고 생각한다"고 설명했다.
정 내정자는 19일 서울 여의도 전경련 회관에서 열린 '제5차 AI 최고위 전략대화'에 참석해 "과거 모바일 시대의 흐름에서는 기업들이 각자 열심히 개발하면 승자가 나왔지만, AI는 기업 간 협업과 생태계의 발현이 중요하다. 정부도 함께 정책을 마련해주시면 좋겠다"고 밝혔다.
그는 "카카오의 AI 방향은 여전히 고민 중이지만 사용자들의 일상생활에 스며들게 하는 방법이 뭘까 질문하고 해답을 찾아가려고 노력 중"이라며 "2022년 오픈 AI 열풍 이후 우리 자체 언어모델을 개발해야 한다는 책임감도 느꼈다. 네이버도 이런 책임감으로 같이 개발하는 것이라고 생각한다"고 말했다.
정 내정자는 AI를 이루는 핵심 요소로 파운데이션 모델, 트레이닝용 데이터, 인프라 등 3가지를 꼽았다.
그는 "파운데이션 모델 관점에서는 '코GPT'를 내부에서 열심히 개발중이고, 작년 7월엔 이미지 생성 모델인 '칼로'를 출시하기도 했다"며 "더 나아가서 오늘은 MLLM을 공개했다. 조만간 쓸 수 있을 것이라고 생각한다"고 설명했다.
실제로 카카오브레인은 이날 이미지를 인식해 텍스트로 답하는 MLLM 오픈소스 '허니비'를 깃허브에 공개했다. 현재 MLLM에 대한 연구는 공개된 모델의 수가 적고, 학습 방법 역시 자세히 공개되지 않아 개발이 어려운 상황이다. 이에 카카오브레인은 MLLM의 발전에 기여하고자 자체 개발한 허니비의 소스코드를 공개하기로 결정했다.
MLLM은 이미지와 명령어(프롬프트)를 입력하면 텍스트로 답변하는 모델이다. 텍스트로만 입출력하는 대규모 언어모델(LLM)에서 확장된 형태다.
이미지와 텍스트를 모두 입력할 수 있기에 허니비는 이미지에 담긴 장면을 묘사하거나 이미지와 텍스트가 혼합된 콘텐츠에 관한 질문을 이해하고 답변할 수 있는 능력을 갖고 있다. 예를 들어 허니비에 '농구 경기 중인 두 명의 선수' 이미지와 함께 '왼쪽 선수는 몇 번 우승했나요?'라는 질문을 영어로 입력하면, 입력된 이미지 내용과 질문을 종합적으로 이해하고 답변을 생성해낸다.
허니비가 이미지와 서비스가 융합된 형태로 기존 LLM보다 진일보한 성능을 보이는 만큼 AI 서비스를 더 확장할 수 있을 것이라는 게 카카오의 기대다.
정 내정자도 허니비에 대해 "아까 행사 단체 사진을 찍었는데, 그 사진 속에서 왼쪽 세번째 기업은 어떤 기업이냐고 물으면 (허니비가) 거기 답을 해줄 수 있다"고 설명했다.
또 정 내정자는 "AI 서비스의 단가를 좀더 낮추는 관점에서는 버티칼 모델을 개발 중이다. 또 온디바이스와 관련해서도 가능한 가장 소형 모델이 무엇이 나올 것인지에 대한 해답도 찾는 중"이라며 "데이터의 관점에서는 신뢰를 높이고 거버넌스를 내부에서 구축해야 한다. 트레이닝 시 어떤 데이터를 넣을지, 퀄리티 점검을 어떻게 할지도 내부에서 좀더 신경쓸 것"이라고 말했다.
그러면서 "인프라의 경우에는 연구개발에 많은 자금이 들어간다. 인프라에 대해서는 정부도 함께 정책을 마련해주시면 좋을 것 같다"며 "앞으로 AI가 일반화되면 환각 효과 등에 고민이 많아질 텐데 윤리 정책도 많이 나올 것 같다. 어떻게 하면 AI를 선한 목적으로 잘 포용할 수 있을지도 고민이 필요할 것"이라고 덧붙였다.
한편 이날 AI 최고위 전략대화는 올해 CES에서 AI 기술 확산이 본격화된 것을 계기로 정부와 국내 대표 기업들이 모여 AI 일상화를 위한 정책방향을 모색하기 위해 개최됐다.
◎공감언론 뉴시스 [email protected]
MLLM은 이미지와 명령어(프롬프트)를 입력하면 텍스트로 답변하는 모델이다. 텍스트로만 입출력하는 대규모 언어모델(LLM)에서 확장된 형태다.
이미지와 텍스트를 모두 입력할 수 있기에 허니비는 이미지에 담긴 장면을 묘사하거나 이미지와 텍스트가 혼합된 콘텐츠에 관한 질문을 이해하고 답변할 수 있는 능력을 갖고 있다. 예를 들어 허니비에 '농구 경기 중인 두 명의 선수' 이미지와 함께 '왼쪽 선수는 몇 번 우승했나요?'라는 질문을 영어로 입력하면, 입력된 이미지 내용과 질문을 종합적으로 이해하고 답변을 생성해낸다.
허니비가 이미지와 서비스가 융합된 형태로 기존 LLM보다 진일보한 성능을 보이는 만큼 AI 서비스를 더 확장할 수 있을 것이라는 게 카카오의 기대다.
정 내정자도 허니비에 대해 "아까 행사 단체 사진을 찍었는데, 그 사진 속에서 왼쪽 세번째 기업은 어떤 기업이냐고 물으면 (허니비가) 거기 답을 해줄 수 있다"고 설명했다.
또 정 내정자는 "AI 서비스의 단가를 좀더 낮추는 관점에서는 버티칼 모델을 개발 중이다. 또 온디바이스와 관련해서도 가능한 가장 소형 모델이 무엇이 나올 것인지에 대한 해답도 찾는 중"이라며 "데이터의 관점에서는 신뢰를 높이고 거버넌스를 내부에서 구축해야 한다. 트레이닝 시 어떤 데이터를 넣을지, 퀄리티 점검을 어떻게 할지도 내부에서 좀더 신경쓸 것"이라고 말했다.
그러면서 "인프라의 경우에는 연구개발에 많은 자금이 들어간다. 인프라에 대해서는 정부도 함께 정책을 마련해주시면 좋을 것 같다"며 "앞으로 AI가 일반화되면 환각 효과 등에 고민이 많아질 텐데 윤리 정책도 많이 나올 것 같다. 어떻게 하면 AI를 선한 목적으로 잘 포용할 수 있을지도 고민이 필요할 것"이라고 덧붙였다.
한편 이날 AI 최고위 전략대화는 올해 CES에서 AI 기술 확산이 본격화된 것을 계기로 정부와 국내 대표 기업들이 모여 AI 일상화를 위한 정책방향을 모색하기 위해 개최됐다.
◎공감언론 뉴시스 [email protected]