Earticle

현재 위치 Home

Oral Session Ⅴ 정보보호

암시적 연계 탐지를 통한 프라이버시 위험 평가 : 언어 모델의 희소한 PII 기억을 중심으로
Probing Implicit Linkage : Assessing Privacy Risks from Sparse PII Memorization in Language Models

첫 페이지 보기
  • 발행기관
    한국차세대컴퓨팅학회 바로가기
  • 간행물
    한국차세대컴퓨팅학회 학술대회 바로가기
  • 통권
    2025 한국차세대컴퓨팅학회 춘계학술대회 (2025.05)바로가기
  • 페이지
    pp.262-265
  • 저자
    Jinhui Zuo, 이석원
  • 언어
    영어(ENG)
  • URL
    https://www.earticle.net/Article/A468960

원문정보

초록

영어
Complex Artificial Intelligence (AI) models pose significant privacy risks as they can potentially memorize sensitive training data. Knowledge probing was proposed to quantify the sensitive information memorized by a trained model. However, in large text datasets, Personally Identifiable Information (PII) is often discrete and sparsely distributed. Consequently, probing isolated PII instances and their limited context fails to effectively determine if the model has learned connections between related PII fragments. To address this limitation, we propose a knowledge probing method specifically designed for scenarios with sparse PII. Our method efficiently identifies and collects PII in the given dataset. It then uses this set for targeted probing to evaluate the model's recall accuracy concerning this information. Experiments demonstrate that our framework effectively reveals a model's capacity to implicitly link related, sparse PII fragments.

목차

Abstract
1. Introduction
2. Related works
3. Our proposal
4. Evaluation
4.1. Results
5. Conclusion
Acknowledgement
References

키워드

Knowledge Probing; Language Models; Personal Privacy; Personally Identifiable Information.

저자

  • Jinhui Zuo [ 아주대학교 인공지능학과 ]
  • 이석원 [ Seok-Won Lee | 아주대학교 소프트웨어학과 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • 설립연도
    2005
  • 분야
    공학>컴퓨터학
  • 소개
    본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

  • 간행물명
    한국차세대컴퓨팅학회 학술대회
  • 간기
    반년간
  • 수록기간
    2021~2025
  • 십진분류
    KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 학술대회 2025 한국차세대컴퓨팅학회 춘계학술대회

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장