기업의 불확실성 해소 및 국민의 프라이버시 보호 효과 기대
[서울=뉴시스]송혜리 기자 = 생성형 인공지능(AI) 모델 개발 시 인터넷에 공개된 데이터를 어떻게 안전하게 활용할 수 있는 지 알려주는 정부 안내서가 마련됐다. 그간 AI가 공개 데이터를 활용하는 것에 관한 명확한 기준이 없어 혼선을 겪던 정보기술(IT)업계에 도움이 될 것으로 보인다.
17일 개인정보보호위원회는 AI 개발에 필수적인 공개 데이터가 현행 개인정보 규율체계 내에서 적법하고 안전하게 처리될 수 있도록 'AI 개발·서비스를 위한 공개된 개인정보 처리 안내서'를 마련해 공개했다.
공개 데이터는 말 그대로 인터넷상에 공개된 사진, 게시물, 영상 등 누구나 합법적으로 접근할 수 있는 데이터를 말한다.
이런 공개된 데이터는 다양한 데이터를 지속적으로 공부해서 보다 똑똑한 답변을 해 내야 하는 챗GPT와 같은 생성형AI의 주요학습 자료가 된다. 이 때문에 AI 기업들은 커먼크롤, 위키백과, 블로그, 웹사이트 등에 있는 공개 데이터를 웹 스크래핑 등의 방식으로 수집해 AI 학습데이터로 활용하고 있다.
문제는 이 공개 데이터에도 주소, 고유식별번호, 신용카드번호 등 여러 개인정보가 포함될 수 있다는 점이다. 하지만 현행 개인정보보호법에는 이러한 공개된 개인정보 처리에 적용될 수 있는 명확한 기준이 없다.
이에 개인정보위는 공개된 개인정보 수집·활용의 법적기준을 명확히 하고 AI 개발 및 서비스 단계에서 어떤 안전조치를 취하는 것이 적정한지에 대해 기업이 참고할 수 있는 최소한의 기준을 제시하는 안내서를 마련했다.
공개된 개인정보를 활용하는 기업들의 개인정보 침해 이슈를 최소화하는 동시에 법적 불확실성을 해소해 기업의 혁신성장을 돕겠다는 취지다.
◆공개 개인정보 처리 지침 없어 혼선…'정당한 이익' 실현 바탕으로 '활용 가능' 명시
안내서를 통해 개인정보위는 개인정보보호법에 따른 '정당한 이익' 조항에 의해 공개된 개인정보를 AI 학습·서비스 개발에 활용할 수 있다는 점을 분명히 했다.
이어 개인정보위는 AI 기업이 '정당한 이익'을 근거로 공개된 개인정보를 처리하기 위해 고려할 수 있는 기술적·관리적 안전성 확보조치와 정보주체 권리보장 방안을 안내했다.
기술적 조치로는 학습데이터 수집출처 검증·관리, 개인정보 유·노출 방지, 개인정보의 안정한 저장·관리, 미세조정을 통한 안전장치 추가, 프롬프트 및 출력 필터링 적용, 학습 결과에서 특정 데이터 삭제 등이 있다.
관리적 안전조치로는 학습데이터 처리 기준 정립 및 개인정보처리방침에 공개, 개인정보 영향평가 수행 고려, AI 프라이버시 레드팀 구성·운영 등이 있고, 정보주체 권리 보장 조치로는 공개된 개인정보 수집 사실과 주요 수집 출처 등을 안내하는 것 등이 있다.
개인정보위는 빠른 AI 기술변화 등을 고려해 세부적 안전조치 등을 유연하게 도입·시행할 수 있도록 했다.
이를 위해 개인정보위는 'AI 사전실태점검'을 통해 파악한 주요 대규모 언어모델(LLM) 사업자의 실제 안전조치 이행사례를 안내해, 기업이 최적 조합을 판단하는 데 참고할 수 있도록 했다.
태현수 개인정보위 과장은 "AI 기업은 모든 안전조치를 의무적으로 시행해야 하는 것은 아니며, 안내서에 제시된 여러 안전조치의 순기능과 AI 성능저하, 편향성 등 부작용과, 기술 성숙도를 고려해 기업의 특성에 맞는 '안전조치의 최적 조합'을 스스로 선택해 이행할 수 있다"고 강조했다.
◆"모든 안전조치를 의무적으로 시행해야 하는 것은 아냐"
안내서는 추후 개인정보 관련 법령 제·개정, AI 기술발전 추이, 해외 규제정비 동향 등을 고려해 지속적으로 업데이트될 예정이다.
아울러 공개된 개인정보와 함께 AI 학습데이터의 주요 원천을 이루는 이용자 개인정보의 적법한 처리 근거와 기준 등에 대해서는 학계, 산업계, 시민단체 등의 의견수렴을 거쳐 구체화해 나갈 예정이다.
이 밖에 개인정보위는 사전적정성 검토제, 규제샌드박스, 개인정보 안심구역 등 혁신지원제도를 통해 AI 기업과 수시로 소통하면서 기술발전과 시장상황을 모니터링하고, 이를 통해 축적된 사례와 경험을 토대로 보호법을 AI 시대에 맞게 정비하는 작업도 추진할 예정이다.
고학수 개인정보위 위원장은 "AI 기술 진보가 빠르게 이루어지고 있지만 AI 개발의 핵심 관건인 공개 데이터 학습이 보호법에 비춰 적법하고 안전한지 여부는 공백인 상황이었다"면서 "이번 안내서를 통해 국민이 신뢰하는 AI·데이터 처리 관행을 기업 스스로 만들어 나가고 이렇게 축적된 모범사례가 안내서에 지속적으로 반영될 수 있기를 기대한다"고 말했다.
◎공감언론 뉴시스 chewoo@newsis.com