네이버와 협업 학습없이 상품 소비이력·텍스트 정보 제공
최대 42% 추천 성능· 253% 학습 속도↑
8월 국제학술대회 ‘KDD 2024’에서 발표 예정
[대전=뉴시스] 김양수 기자 = 최근 소셜 미디어, 전자상거래 플랫폼 등의 발전으로 대형언어모델(Large Language Model·LLM) 기술이 주목받는 가운데 한국 연구진이 기존의 대형언어모델 기반 추천 기술의 한계를 극복할 수 있는 시스템을 개발했다.
한국과학기술원(KAIST)은 산업및시스템공학과 박찬영 교수팀이 네이버와 공동연구를 통해 협업 필터링(Collaborative filtering)의 추천 모델이 사용자 선호에 대한 정보를 추출하고 이를 상품 텍스트와 함께 대형언어모델에 주입해 높은 정확도로 상품을 추천할 수 있는 새로운 대형언어모델 기반 추천시스템 기술을 개발했다고 17일 밝혔다.
이번 연구에서 박 교수팀은 기존에 비해 학습 속도 253%, 추론 속도 171%, 상품 추천에서 평균 12%의 성능 향상을 이끌어 냈다.
특히 사용자의 소비이력이 풍부하지 않은 퓨샷(Few-shot) 상품 추천에서 평균 20%의 성능 향상, 다중-도메인(Cross-domain) 상품 추천에서는 42%의 성능 향상을 이뤄냈다.
다중-도메인 상품 추천은 의류 도메인에 추천 모델을 학습한 뒤 도서 도메인에서 추천을 수행하는 것처럼 타 도메인에서 학습된 모델을 활용, 추가학습없이 현재 도메인에서 추천을 수행하는 행위다.
기존 대형언어모델을 활용한 추천 기술들은 사용자가 소비한 상품 이름들을 단순히 텍스트 형태로 나열해 대형언어모델에 주입하는 방식으로 추천을 진행했다.
이번에 연구팀은 상품 제목 및 설명과 같은 텍스트뿐 아니라 사용자와 비슷한 상품을 소비한 다른 사용자들에 대한 정보인 협업 필터링 지식이 정확한 상품 추천에 중요한 역할을 한다는 점에 주목했다.
연구팀은 미리 학습된 협업 필터링 기반 추천 모델로부터 사용자의 선호에 대한 정보를 추출하고 이를 대형언어모델이 이해할 수 있도록 변환하는 경량화된 신경망을 도입, 협업필터링 정보를 텍스트화했다.
이 기술은 대형언어모델의 추가적인 학습이 필요하지 않다. 연구팀은 대형언어모델의 직접적인 학습 대신 경량화된 신경망의 학습을 통해 대형언어모델이 사용자의 선호를 이해할 수 있도록 했고 이에 따라 기존 연구보다 빠른 학습 및 추론 속도를 달성했다고 설명했다.
KAIST 산업및시스템공학과 김세인 박사과정 학생과 전산학부 강홍석 학사과정(졸) 학생이 공동 제1 저자, 네이버의 김동현·양민철 박사가 공동 저자, KAIST 산업및시스템공학과의 박찬영 교수가 교신저자로 참여한 이번 연구는 데이터마이닝 최고권위 국제학술대회인 ‘국제 데이터 마이닝 학회 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2024)’에서 다음달 발표될 예정이다.(논문명: Large Language Models meet Collaborative Filtering: An Efficient All-round LLM-based Recommender System).
박찬영 교수는 "이 기술은 사용자-상품 상호작용 정보를 전통적인 협업 필터링 모델에서 추출해 대형언어모델에 전달하는 새로운 방법"이라며 "대화형 추천 시스템이나 개인화 상품정보 생성 등 다양한 고도화된 개인 추천 서비스를 등장시킬 수 있을 것으로 기대한다"고 말했다.
◎공감언론 뉴시스 kys0505@newsis.com
한국과학기술원(KAIST)은 산업및시스템공학과 박찬영 교수팀이 네이버와 공동연구를 통해 협업 필터링(Collaborative filtering)의 추천 모델이 사용자 선호에 대한 정보를 추출하고 이를 상품 텍스트와 함께 대형언어모델에 주입해 높은 정확도로 상품을 추천할 수 있는 새로운 대형언어모델 기반 추천시스템 기술을 개발했다고 17일 밝혔다.
이번 연구에서 박 교수팀은 기존에 비해 학습 속도 253%, 추론 속도 171%, 상품 추천에서 평균 12%의 성능 향상을 이끌어 냈다.
특히 사용자의 소비이력이 풍부하지 않은 퓨샷(Few-shot) 상품 추천에서 평균 20%의 성능 향상, 다중-도메인(Cross-domain) 상품 추천에서는 42%의 성능 향상을 이뤄냈다.
다중-도메인 상품 추천은 의류 도메인에 추천 모델을 학습한 뒤 도서 도메인에서 추천을 수행하는 것처럼 타 도메인에서 학습된 모델을 활용, 추가학습없이 현재 도메인에서 추천을 수행하는 행위다.
기존 대형언어모델을 활용한 추천 기술들은 사용자가 소비한 상품 이름들을 단순히 텍스트 형태로 나열해 대형언어모델에 주입하는 방식으로 추천을 진행했다.
이번에 연구팀은 상품 제목 및 설명과 같은 텍스트뿐 아니라 사용자와 비슷한 상품을 소비한 다른 사용자들에 대한 정보인 협업 필터링 지식이 정확한 상품 추천에 중요한 역할을 한다는 점에 주목했다.
연구팀은 미리 학습된 협업 필터링 기반 추천 모델로부터 사용자의 선호에 대한 정보를 추출하고 이를 대형언어모델이 이해할 수 있도록 변환하는 경량화된 신경망을 도입, 협업필터링 정보를 텍스트화했다.
이 기술은 대형언어모델의 추가적인 학습이 필요하지 않다. 연구팀은 대형언어모델의 직접적인 학습 대신 경량화된 신경망의 학습을 통해 대형언어모델이 사용자의 선호를 이해할 수 있도록 했고 이에 따라 기존 연구보다 빠른 학습 및 추론 속도를 달성했다고 설명했다.
이시간 핫뉴스
KAIST 산업및시스템공학과 김세인 박사과정 학생과 전산학부 강홍석 학사과정(졸) 학생이 공동 제1 저자, 네이버의 김동현·양민철 박사가 공동 저자, KAIST 산업및시스템공학과의 박찬영 교수가 교신저자로 참여한 이번 연구는 데이터마이닝 최고권위 국제학술대회인 ‘국제 데이터 마이닝 학회 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2024)’에서 다음달 발표될 예정이다.(논문명: Large Language Models meet Collaborative Filtering: An Efficient All-round LLM-based Recommender System).
박찬영 교수는 "이 기술은 사용자-상품 상호작용 정보를 전통적인 협업 필터링 모델에서 추출해 대형언어모델에 전달하는 새로운 방법"이라며 "대화형 추천 시스템이나 개인화 상품정보 생성 등 다양한 고도화된 개인 추천 서비스를 등장시킬 수 있을 것으로 기대한다"고 말했다.
◎공감언론 뉴시스 kys0505@newsis.com