초대규모 AI 언어모델 성능 극대화해 누구나 쉽게 AI 개발 가능
비개발자도 데이터셋만 있다면 간편하게 원하는 언어모델 구현할 수 있어
대규모 언어모델 전체 학습 비해 비용 및 작업 시간 효율적으로 절감
[서울=뉴시스]송종호 기자 = 네이버클라우드는 노코드(No Code) 인공지능(AI) 플랫폼 ‘클로바 스튜디오’에 튜닝 기능을 신규 추가했다고 23일 밝혔다.
이에 대해 네이버클라우드는 하이퍼클로바 언어모델의 가능성을 극대화해 사용자 목적에 맞는 최적화가 가능해졌다고 설명했다.
◆전문 지식 없이도 AI 개발 가능…하이퍼클로바 언어모델이 보유한 가능성 극대화
클로바 스튜디오는 개발 관련 전문 지식이 없이도 AI의 적용 가능성을 탐색하고 실제 서비스에 적용해볼 수 있는 노코드 AI 플랫폼이다. 자세히 살펴보면 ▲비개발자도 자유롭게 텍스트 기반으로 AI를 실험해볼 수 있는 플레이그라운드 ▲다른 사용자들이 작업한 AI를 둘러보고 활용할 수 있는 익스플로러 ▲사용자들끼리 의견과 질의응답을 나누는 포럼 공간 등으로 구성됐다.
현재 클로즈드 베타 서비스로 제공 중인 클로바 스튜디오는 기능을 지속해서 업데이트하고 있다. 새롭게 추가된 튜닝 기능은 사용자 데이터를 학습한 후 하이퍼클로바 언어모델 매개변수 일부를 과제 종류, 언어, 데이터 등에 맞게 최적화해 활용하는 방식이다.
자체 AI 기술 및 인력을 보유하지 않아도 규격화된 데이터셋을 일정량 이상 업로드하면 비개발자도 쉽고 간편하게 원하는 언어모델을 만들 수 있다. 또 하이퍼클로바 언어모델은 네이버 데이터를 기반으로 사전 학습됐기 때문에 사용자는 튜닝을 통해 네이버의 지식과 데이터를 활용하는 효과도 볼 수 있다.
튜닝 기능은 하이퍼클로바 언어모델이 지닌 가능성을 극대화할 수 있다. 지금까지는 플레이그라운드에서 프롬프트를 통해 예시, 지시문 등을 입력문서로 받아 그 의미를 파악하고 요약, 분류, 창작 등 과제를 수행하는 인컨텍스트 러닝(in-context-learning)방식으로만 시도했다. 이 경우 프롬프트 구성 형태에 따라 언어모델의 생성 품질이 달라지고 프롬프트 글자수의 제한도 존재한다.
하지만 튜닝 기능을 사용하면 인컨텍스트 러닝 방식 대비 안정적이고 우수한 성능을 보이며 프롬프트 글자수 제한이나 의존도를 낮출 수 있는 장점이 있다. 또 튜닝을 통해 모델이 사용자 의도에 적합하게 학습됐는지 간편하게 시험해볼 수 있으며, 이를 응용프로그램 인터페이스(API)로 활용해 서비스에 실제 적용할 수도 있다.
◆비용·시간 절감…영어 등 다국어 모델 추가 예정
비용 및 작업 시간도 효율적으로 절감할 수 있다. 대규모 언어모델 전체를 학습하는 것에 비해 적은 비용으로 다양한 자연어 처리(NLP) 과제에 쉽고 빠르게 하이퍼클로바 언어모델 적용이 가능하다. 성능은 몇백에서 몇천 건의 적은 데이터셋 학습만으로도 수만 건을 학습한 기존 대규모 언어모델 수준에 달한다.
현재 튜닝을 통해 문서 이중 및 다중 분류, 문장 요약, 문장 생성, 문장 교정, 문체 전환 등 6개 NLP 과제를 수행할 수 있다. 네이버는 올해 6월부터 시범 운영을 거쳐 대화, 요약, 번역, 분류 등 NLP 과제에 폭넓게 활용하며 서비스 성능을 크게 향상했다. 대표적으로 AI 돌봄 전화 서비스인 클로바 케어콜은 튜닝을 통해 데이터 검수율이 기존 30%에서 91%까지 대폭 개선됐다.
네이버는 튜닝 기능에 한국어 모델만 제공 중이나 영어 등 다국어 모델도 추가할 계획이다. 또 수행할 수 있는 NLP 과제의 종류와 튜닝 기법도 계속 확장할 예정이다. 클로바 스튜디오 이용은 네이버 클라우드 플랫폼을 통해 신청할 수 있다.
◎공감언론 뉴시스 song@newsis.com