"에이스, 편집자 개입 없이 이용자 피드백 데이터 수집"
"스포츠.연예 기사, 최신성.클릭수 바탕 서비스 제공"
기사 품질평가 방법 개발해 실행 뒤 결과 공개 제언
맹성현 위원장은 이날 서울 프레스센터에서 발표회를 통해 "뉴스 검색 개발-운영-개선에 대한 의사 결정 이력이 모두 기록되고, 이용자 피드백을 수집하고 반영해 실제 이용자들의 검색 품질 만족도를 꾸준히 평가하고 있음을 확인했다"며 이같이 밝혔다.
네이버 뉴스 알고리즘 검토위원회는 지난 5월 컴퓨터공학과 정보학, 커뮤니케이션 등 3개 분야 전문가 11명으로 구성됐다. 검토위는 네이버 뉴스 서비스를 ▲뉴스 검색(랭킹 알고리즘) 서비스 ▲에어스(AiRS) 뉴스 추천 서비스 ▲스포츠 및 연예 서비스 기사 추천 서비스로 구분했다.
이후 각 서비스에 대한 데이터의 확보 과정, 실제 검색 결과를 결정하는 알고리즘과 그에 반영되는 자질, 이용자에게 서비스가 실제로 공개되는 과정, 전체 과정에 대해 수립된 절차의 적절성 등을 검토했다.
검토위는 뉴스 검색 서비스 영역에서 가이드라인을 기반으로 품질 평가 방향이 정립돼 있으며, 향후 시스템을 정착시키는 것이 중요하다고 평가했다. 네이버 뉴스 랭킹 학습 알고리즘으로는 SVMRank가 사용되고 있으며, 다른 학습 알고리즘을 사용하기에 적합하지 않아 알고리즘 교체 보다는 자질 발굴에 초점을 두고 있다고 결론 냈다.
특히 에어스 뉴스 추천 서비스의 경우 네이버가 편집자의 개입 없이 자동적으로 뉴스 이용자들의 피드백 데이터를 수집해 학습 데이터를 확보하고 있는 것으로 나타났다. 협력필터(Collaborative Filtering)와 품질모델(Quality Model)을 결합해 이용자의 기사 선호도와 기사 품질을 고려한 개인화된 추천 점수를 계산하는 알고리즘을 활용하고 있음을 확인했다.
이 과정에서 이용자의 기존 관심사와는 다른 분야의 기사도 함께 추천될 수 있도록 해 '필터버블(Filter Bubbles)' 문제를 최소화하고 있는 것으로 나타났다.
연예 및 스포츠 기사 추천 서비스는 최신성과 기사 클릭 수치와 같은 피드백 정보를 바탕으로 비(非) 맞춤형 뉴스 추천 서비스를 제공한 것으로 나타났다. 이는 일반 분야 뉴스 기사와는 수집되는 기사의 양과 형태, 뉴스 정보의 유효기간 등이 다르다는 특징을 고려했다. 뉴스 서비스에 비해 데이터 기반의 기계 학습이 아닌 규칙 기반의 알고리즘을 바탕으로 서비스가 운영되고 있다.
다만 검토위는 연예 및 스포츠 기사 추천 알고리즘의 핵심 역할을 하는 자질이 현재는 체계적으로 적절히 활용되고 있으나 시간이 지나며 효용성에 변화가 있을 수 있으므로 꾸준한 검증이 필요할 것이라 밝혔다.
검토위는 "뉴스 서비스 전반에 걸친 알고리즘의 공정성 및 투명성과 관련해 발전 방안을 논의한 것은 세계 최초의 시도이며 매우 고무적이다"며 "네이버의 뉴스 서비스 자동화는 공정성과 신뢰성 문제 해결을 위한 효율적인 대안으로 평가된다"고 평가했다.
향후 위원회는 학습 데이터 구축 주기를 단축시키고, 다양한 연령층을 포괄하며 알고리즘 선을 위한 연구개발에 힘쓸 것을 권고했다. 또 좋은 기사에 대한 공통 기준을 확립하고 기사 품질 평가 방법을 개발해 주기적으로 실행한 뒤 결과를 문서화해 전체 서비스에 공유하는 업무 관리체계를 갖출 것을 요구했다.
한편 네이버는 뉴스 편집 기능에 대한 비판이 확산되며 뉴스를 중심으로 여러 콘텐츠를 정리해서 보여줬던 '포털식' 화면을 포기하고, 올해 말부터 모바일 서비스 첫 화면에 초록색 검색창인 '그린닷'만 남기기로 결정했다.
대신 뉴스판은 첫 화면을 옆으로 밀면 나오는 두 번째 화면에 배치했다. 언론사별로 직접 편집한 뉴스가 노출되고, 사용자가 언론사를 선택하는 방식으로 운영된다. 특히 인공지능 추천 뉴스피드 AiRS(에어스)를 통해 개인의 관심사와 뉴스 소비 이력을 분석해 네이버가 뉴스를 추천해주는 서비스도 제공키로 했다.
lgh@newsis.com