"서류작업 대신 AI 개발에만 집중"…가명정보 활용 문턱 낮춘다

개인정보위, 가명정보 처리 가이드라인 개정

활용 주체·환경 따라 위험도 차등 관리

내부 연구는 담당자 검토로 간소화…고위험 반출시에만 외부 심의

목적 확장 허용 등 가명정보 지속 활용 기준 유연화

[서울=뉴시스] 개인정보보호위원회 CI. (사진=개인정보보호위원회 제공) 2026.03.12. photo@newsis.com *재판매 및 DB 금지

[서울=뉴시스] 개인정보보호위원회 CI. (사진=개인정보보호위원회 제공) 2026.03.12. [email protected] *재판매 및 DB 금지

[서울=뉴시스] 신효령 기자 = #1. OO대학교 지역개발연구소는 지난해 농업경영체 등록정보를 가명 처리해 지역별 농업 인력 수급 현황을 분석했다. 올해도 전년도 결과와 비교해 인력 구조가 어떻게 변했는지 추세를 분석하는 연구를 준비 중이다.

이름과 연령 등 개인정보를 '홍XX, 30대'와 같이 가명 처리하면 정보 주체 동의 없이도 활용이 가능했으나, 그 과정은 험난했다. 작년과 같은 데이터, 비슷한 연구 목적이라도 다시 처음부터 외부 전문가 심의를 받고, 방대한 서류 작업을 해야 했기 때문이다. 앞으로는 이런 반복적인 내부 연구의 경우 담당자 검토만으로도 데이터 활용이 가능해졌다.

개인정보보호위원회는 인공지능 전환(AX) 시대를 맞아 이 같은 내용을 골자로 한 '가명정보 처리 가이드라인'을 전면 개정했다고 31일 밝혔다.

이에 따라 인공지능(AI) 학습이나 과학적 연구에 필수적인 '가명정보' 활용 문턱이 획기적으로 낮아진다. 그동안 복잡한 절차와 서류 부담 때문에 지체됐던 데이터 활용이 위험도에 따른 차등 관리 체계로 전환되면서, AI 모델 고도화와 공공 데이터 개방에 속도가 붙을 전망이다.

"누가, 어디서 쓰나"…위험도 따라 절차 간소화

가명정보란 특정 개인이 식별되지 않도록 성명, 주민등록번호 등 일부 정보를 삭제하거나 대체한 데이터를 말한다. 개인정보를 안전하게 보호하면서도, 정보주체의 동의 없이 AI 학습이나 과학적 연구 등에 데이터를 가치 있게 활용할 수 있도록 도입된 제도다.

예를 들어, 병원에서 환자의 '이름, 상세 주소, 전화번호'를 지우고 '환자A, 40대, 서울 거주'와 같은 형태로 바꾸는 방식이다. 이렇게 하면 연구자는 특정인이 누구인지 알 수 없으면서도 '40대 서울 거주자의 질환 통계'와 같은 유의미한 분석을 할 수 있다. AI 모델 고도화나 신약 개발 등에 핵심적인 역할을 한다.

2020년 도입된 가명정보 제도는 그동안 표준화된 판단 기준이 없었다. 같은 데이터라도 담당자나 기관에 따라 위험도 판단이 달랐고, 이에 따라 요구되는 서류와 심의 수준도 제각각이었다. 가명정보 결합 등 전체 과정에 300일 이상 걸린 사례도 있었다.

이에 개인정보위는 최근 50개 AI 기업과 1441개 전체 공공기관을 대상으로 실태조사와 인터뷰를 실시했다. 또한 실무자와 전문가가 참여하는 태스크포스(TF)를 가동했다. "위험성 판단 기준이 모호하다", "불필요한 서류가 너무 많다"는 등의 현장 목소리를 반영해 가이드라인을 개정했다.

개정안의 핵심은 '위험도 기반 판단 체계' 확립이다. 데이터를 '누가, 어디서 쓰느냐'를 기준으로 저·중·고위험 3단계로 나눠 규제를 차등 적용한다.

'저위험'은 같은 기관 안에서 서비스 이용 통계 작성을 위해 가명정보를 활용하는 경우다. 예를 들어 OO대학병원 연구팀이 지난해 사용한 심혈관 질환 데이터를 올해도 같은 방식으로 활용하는 경우다. 외부 유출 위험이 낮기 때문에 별도 전문가 심의 없이 담당자 검토만으로 절차를 끝낼 수 있다.

중위험은 외부 기관에 데이터를 제공하되, 제공 기관이 통제할 수 있는 분석 공간 내에서만 처리하는 경우다. A병원이 보유한 환자 데이터를 B 의료 AI 기업에 제공하지만, 기업으로 데이터를 반출하지 않고 병원 내부 분석 공간에서만 활용하도록 하는 방식이다. 이 경우 외부 반출보다 위험이 낮지만, 최소 2인 이상의 내부 심의가 필요하다.

고위험은 제3자에게 데이터를 외부로 반출해 제공하거나, 음성·영상 등 재식별 위험이 큰 데이터를 처리하는 경우다. AI 업체가 모델 학습을 위해 환자의 상담 음성 파일이나 자유형 텍스트 기록을 제공받는 경우가 여기에 해당한다. 이때는 반드시 외부 전문가가 포함된 적정성 검토위원회를 구성해 심의를 거쳐야 한다.

[서울=뉴시스]

영상·이미지 데이터도 활용 길 열려…AI 맞춤형 개편

이번 개정으로 기존 24종에 달하던 서류 양식은 10종으로 통합·축소됐다. 위험도가 낮은 연구일수록 작성해야 할 서류는 더 줄어드는 구조다.

AI 산업 특성을 반영한 규제 혁신도 포함됐다. 기존 제도는 한 번 정한 목적과 기간 안에서만 데이터를 활용하도록 돼 있어, 반복 학습과 모델 고도화가 필요한 AI 개발에는 맞지 않는다는 지적이 많았다.

예를 들어 '폐질환 예측 AI'를 개발한 뒤 이를 유사한 폐 관련 응용 연구로 확대하려고 해도, 기존에는 다시 처음부터 절차를 밟아야 했다. 앞으로는 유사한 범위 안에서 '확장 가능한 목적'을 사전에 설정할 수 있게 된다. 또한 AI 모델 개발과 고도화가 목적이라면 필요한 기간 동안 가명정보를 보다 유연하게 활용할 수 있도록 기준도 완화된다.

특히 의료 AI 개발의 난제로 꼽혔던 엑스레이(X-ray), MRI(자기공명영상) 등 비정형 데이터 검수 방식이 개선됐다. 상담 음성 정보나 텍스트 데이터는 이름, 전화번호 등 식별 정보의 제거 여부를 일일이 확인하는 '전수 검수' 부담이 컸으나, 앞으로는 표본 검수, 통계적 검사, 전문가 선별 검토 등 다양한 방식이 허용된다. 개인정보위는 이번 조치로 그간 책임 부담과 절차 문제로 데이터 제공에 소극적이었던 공공기관과 병원들의 참여가 크게 늘어날 것으로 기대한다.

송경희 개인정보보호위원장은 "그간 가명정보 제도는 절차가 복잡하고 보수적 운영으로 진입장벽이 높았다"며 "현장의 애로사항을 밑바닥부터 청취해 전면 개편한 만큼, 이번 조치가 AX 환경에서 데이터 활용이 획기적으로 늘어나는 전환점이 될 것"이라고 밝혔다.

◎공감언론 뉴시스 [email protected]

"서류작업 대신 AI 개발에만 집중"…가명정보 활용 문턱 낮춘다

개인정보위, 가명정보 처리 가이드라인 개정

활용 주체·환경 따라 위험도 차등 관리

내부 연구는 담당자 검토로 간소화…고위험 반출시에만 외부 심의

목적 확장 허용 등 가명정보 지속 활용 기준 유연화

"누가, 어디서 쓰나"…위험도 따라 절차 간소화

영상·이미지 데이터도 활용 길 열려…AI 맞춤형 개편

"서류작업 대신 AI 개발에만 집중"…가명정보 활용 문턱 낮춘다

이시간 핫뉴스

많이 본 기사