과학기술데이터 특화 생성형 언어 모델. LLM 수요 대응
[대전=뉴시스] 김양수 기자 = 한국과학기술정보연구원(KISTI)은 과학기술데이터에 특화된 생성형 거대 언어 모델(LLM) 'KONI(KISTI Open Natural Intelligence·고니) 13b'를 개발했다고 20일 밝혔다.
쳇(Chat)GPT와 같은 LLM 기술은 다양한 사용자의 질의에 풍부한 답변을 할 수 있어 지난해 11월 출시부터 많은 관심을 받고 있으며 국내에서는 네이버, KT, LG AI 연구원 같은 대기업들을 중심으로 여러 LLM들이 개발되고 있다.
하지만 정부출연연구원이나 공공기관은 민감 정보나 보안 등의 문제로, 중소기업은 비용문제로 이들을 활용하는데 한계가 있다.
이에 따라 KISTI는 보안이나 정보 유출에 안전하면서도 기존의 LLM이 갖는 단점(환각현상)을 최소화하고 다양한 과학기술·산업 분야에 특화된 KONI를 개발했다.
KONI는 기존 정보 서비스 시스템이 보유한 데이터를 답변 제공에 활용할 수 있도록 검색 증강 생성 기술(RAG) 적용이 쉽도록해 기존의 환각문제를 최소화했다.
또한 파인 튜닝 시 요구되는 전산비용을 줄이고 다양한 분야의 LLM 수요에 빠르게 대응할 수 있도록 적용 분야별 어댑터 형식의 파인튜닝을 적용했다.
이로 KISTI의 KONI 모델은 보안 및 정보 유출이나 비용 부족의 문제로 LLM 도입을 주저하던 출연연, 국회, 군, 중소기업에서 도입이 한결 손쉽게 됐다.
KISTI는 KONI-13b 모델 성능을 현재 130억 개 파라미터 수준에서 지속 늘리고 학습 데이터도 추가로 확보해 민간과 전문과학자 모두가 활용할 수 있는 '공학박사' 수준의 AI 정보 서비스 체계로 고도화를 나갈 계획이다.
KISTI 김재수 원장은 "이번 KONI 13b의 개발을 통해 공공과 민간의 다양한 과학기술·산업 분야 LLM 수요에 대응하고 외부 기관들과의 협력 체계도 더욱 확고히 할 것"이라며 "사용자 피드백을 반영해 KONI 모델의 성능을 지속적으로 개선해 나가겠다"고 말했다.
◎공감언론 뉴시스 [email protected]
쳇(Chat)GPT와 같은 LLM 기술은 다양한 사용자의 질의에 풍부한 답변을 할 수 있어 지난해 11월 출시부터 많은 관심을 받고 있으며 국내에서는 네이버, KT, LG AI 연구원 같은 대기업들을 중심으로 여러 LLM들이 개발되고 있다.
하지만 정부출연연구원이나 공공기관은 민감 정보나 보안 등의 문제로, 중소기업은 비용문제로 이들을 활용하는데 한계가 있다.
이에 따라 KISTI는 보안이나 정보 유출에 안전하면서도 기존의 LLM이 갖는 단점(환각현상)을 최소화하고 다양한 과학기술·산업 분야에 특화된 KONI를 개발했다.
KONI는 기존 정보 서비스 시스템이 보유한 데이터를 답변 제공에 활용할 수 있도록 검색 증강 생성 기술(RAG) 적용이 쉽도록해 기존의 환각문제를 최소화했다.
또한 파인 튜닝 시 요구되는 전산비용을 줄이고 다양한 분야의 LLM 수요에 빠르게 대응할 수 있도록 적용 분야별 어댑터 형식의 파인튜닝을 적용했다.
이로 KISTI의 KONI 모델은 보안 및 정보 유출이나 비용 부족의 문제로 LLM 도입을 주저하던 출연연, 국회, 군, 중소기업에서 도입이 한결 손쉽게 됐다.
KISTI는 KONI-13b 모델 성능을 현재 130억 개 파라미터 수준에서 지속 늘리고 학습 데이터도 추가로 확보해 민간과 전문과학자 모두가 활용할 수 있는 '공학박사' 수준의 AI 정보 서비스 체계로 고도화를 나갈 계획이다.
KISTI 김재수 원장은 "이번 KONI 13b의 개발을 통해 공공과 민간의 다양한 과학기술·산업 분야 LLM 수요에 대응하고 외부 기관들과의 협력 체계도 더욱 확고히 할 것"이라며 "사용자 피드백을 반영해 KONI 모델의 성능을 지속적으로 개선해 나가겠다"고 말했다.
◎공감언론 뉴시스 [email protected]