IT 관련/보안

[새싹 성동 2기] 개인정보보호와 비식별화

insu90 2024. 12. 16. 17:40

1. 가명정보 개념과 이해

가명정보란?

  • 정의: 특정 개인을 알아볼 수 없도록 변환한 개인정보. 단, 추가 정보와 결합하지 않는 한 개인을 식별할 수 없어야 함.
  • 특징:
    • 개인정보의 일종이지만, 재식별 가능성이 최소화됨.
    • 익명정보와는 다름. 익명정보는 원천적으로 개인 식별이 불가능한 데이터.
    • 활용 가능 사례: 빅데이터 분석, AI 모델 학습, 공공 데이터 연구 등.

2. 가명정보 관련 제도

주요 법령과 가이드라인

  1. 개인정보보호법: 가명정보 처리 및 활용에 대한 법적 근거 마련.
  2. 신용정보법: 금융 분야에서 가명정보를 활용한 데이터 결합과 분석 가능.
  3. 관련 가이드라인:
    • 금융, 의료, 교육, 공공 등 분야별로 처리 방식이 다르게 적용됨.
    • 일반적으로 개인정보보호위원회의 가이드라인을 기반으로 적용.

가명정보 활용의 핵심 원칙

  • 목적 제한: 통계, 연구, 공익적 기록보존 목적에 한정.
  • 안전 조치: 재식별 방지를 위한 기술적, 관리적 조치 의무화.
  • 동의 면제: 정보 주체의 동의 없이도 활용 가능하나, 제도적 허용 범위 내에서만 사용.

3. 가명처리 및 결합 절차

가명처리 절차 (5단계)

  1. 사전 준비:
    • 처리 목적 설정: 가명처리 목적을 명확히 정의.
    • 대상 항목 선정: 최소한의 정보만 가명처리.
  2. 위험성 검토:
    • 데이터 식별 가능성 평가: 데이터 및 환경의 식별 위험 분석.
    • 처리 방식 선택: 위험에 따라 암호화, 삭제, 범주화 등 적합한 방식 결정.
  3. 가명처리 수행:
    • 데이터 변환: 식별자 제거, 범주화, 암호화 등 가명처리 기법 적용.
    • 추가 정보 분리 보관: 재식별 방지를 위한 추가 정보와 데이터 분리.
  4. 적정성 검토:
    • 가명처리 결과가 법적, 기술적 기준을 만족하는지 평가.
  5. 안전한 관리:
    • 가명처리 기록 보관, 접근 권한 분리, 재식별 방지 조치 유지.

가명정보 결합 절차

  • 결합전문기관 활용:
    공통된 결합키를 사용해 결합 대상 정보를 전문기관에서 결합하고, 활용 기관은 결과 데이터만 받음.

4. 가명처리 기술

기술 유형과 활용법

  1. 삭제:
    • 식별 가능한 데이터를 삭제하여 개인을 추적 불가하게 만듦.
    • 활용: 이름, 상세 주소, 전화번호 삭제.
  2. 암호화:
    • 특정 규칙에 따라 데이터를 암호화해 식별 불가능한 형태로 변환.
    • 기술: 양방향 암호화(복호화 가능), 일방향 암호화(복호화 불가).
  3. 범주화(일반화):
    • 데이터를 상위 그룹으로 묶음.
    • 예: 출생일 → 출생 연도 → 연령대(30대, 40대).
  4. 무작위화:
    • 데이터 값을 임의로 변경해 원본 추적을 어렵게 함.
    • 기술: 잡음 추가, 순열, 난수 생성.
  5. 라운딩:
    • 숫자를 특정 기준으로 반올림/내림 처리.
    • 활용: 구매 금액, 연령 등 민감 데이터를 대략적인 값으로 변경.

5. 가명처리 기법 실습

엑셀을 활용한 기본 실습

  • 삭제 기법: 특정 셀의 민감 데이터를 지우기.
  • 범주화 기법: 나이 데이터를 "20대", "30대"처럼 범주형 데이터로 변경.
  • 암호화 기법: SHA256 함수를 사용해 텍스트를 암호화.
    • 예: =TO_SHA256("홍길동").

*생성형 AI 활용한 클라우드&보안 전문가 양성캠프 과정의 교육내용 정리 자료입니다.