개인정보보호위원회-KISA 조사 후 데이터 삭제 진행
"개인정보 유출 위험 없으나 이용자 불안감 고려해 폐기"
"삭제 원하는 이용자 신청 받은 후 데이터 모두 삭제 예정"
스캐터랩은 현재 한국인터넷진흥원(KISA)과 개인정보보호위원회의 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델의 폐기를 진행한다는 방침이다.
스캐터랩 관계자는 "이용자들의 불안감을 고려해 이번 인공지능 '이루다'의 DB 전량과 딥러닝 대화 모델을 폐기하기로 했다"고 말했다.
스캐터랩 측은 다만 이루다 DB는 비식별화 절차를 거쳐 개별적이고 독립적인 문장 단위로 이뤄져 개인 식별이 가능한 데이터는 없다고 밝혔다. 또한 딥러닝 대화 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고, 인공지능은 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다고 언급했다.
스캐터랩은 이루다 개발에 활용된 ‘연애의과학’과 ‘텍스트앳’에서 데이터 활용을 원하지 않는 이용자로부터 신청을 받은 후 해당 데이터를 모두 삭제할 예정이다. 이는 향후 딥러닝 대화 모델에도 이용되지 않는다.
관련 후속 조치는 각 어플리케이션 공지를 통해 안내 받을 수 있다. 향후 신규 가입과 서비스 이용시에는 개인정보 수집, 이용 동의 절차를 강화할 계획이다.
앞서 이루다는 20세 여성 캐릭처로 설정해 지난해 12월23일 출시됐다. 출시된 지 2주 만에 이용자 75만명을 기록하기도 했다. 하지만 온라인 커뮤니티 등에서 이루다에 대한 성희롱 논란이 휩싸였다.
게다가 동성애, 장애인 등 사회적 소수자에 대한 혐오발언에 이어 연애의 과학 이용자들의 카카오톡 대화를 학습하면서 사용됐던 데이터가 제대로 익명화되지 않아 개인정보유출 의혹까지 일자 지난 12일 서비스를 잠정 중단했다. 하지만 연애의과학 이용자들은 스캐터랩이 개인정보를 유출했다면서 집단소송을 준비하고 있다.
스캐터랩은 전날 "깃허브에 공개한 오픈소스에 내부 테스트 샘플이 포함된 사실이 확인됐다. 실명을 자동화 비식별 처리했는데, 필터링 과정에 걸러지지 않은 부분이 일부 존재했다”며 “데이터 관리에 신중하지 못했다. 민감할 수 있는 정보가 노출된 점에 진심으로 사과드린다"고 사과문을 냈다.
◎공감언론 뉴시스 lje@newsis.com