셀렉트스타 개발 LLM 답변 무해성 평가 위한 벤치마크 데이터
최신 사회적 이슈 반영하고 기준표 사용해 체계적 평가
[서울=뉴시스]심지혜 기자 = 한국정보통신기술협회(TTA)는 셀렉트스타가 개발한 ‘거대언어모델(LLM) 무해성 평가 데이터'에 데이터품질 인증(DQ)을 국내 최초로 부여했다고 16일 밝혔다.
DQ인증은 ‘데이터 산업진흥 및 이용 촉진에 관한 기본법’에 근거해 데이터 내용과 관리체계를 심사해 인증하는 제도다.
TTA는 과학기술정보통신부로부터 데이터품질 인증기관으로 지정받아 정형 데이터, 비정형 데이터, 데이터 관리체계 등 3가지 영역에서 인증 서비스를 제공하고 있다.
DQ인증을 받은 셀렉트스타의 ‘LLM 무해성 평가 데이터’는 LLM이 생성하는 답변의 무해성을 평가하기 위한 벤치마크 데이터로 편향성, 혐오, 위법성, 민감성 등 주요 4개 영역을 평가할 수 있도록 설계됐다.
이 데이터는 최신 사회적 이슈를 반영한 시의성 평가 항목과 평가 기준표(Rubric)를 사용해 체계적으로 평가하는 방식을 설계한 점이 특징이다.
TTA는 LLM의 편향성, 위법성 등의 평가에 사용될 질문 문장을 심사하는 과정에서 질문 문장의 명료성과 의미 전달성 등도 심사했다.
손승현 TTA 회장은 "대규모 언어 모델(LLM) 벤치마크 데이터의 품질은 AI 모델이 신뢰받고 안전하게 활용되기 위한 필수 요소"라며 "이번 인증은 LLM 평가 데이터의 품질을 확보함으로써 AI 산업 전반의 발전과 사용자 신뢰 확보에 중요한 역할을 할 것"이라고 말했다.
◎공감언론 뉴시스 [email protected]