요약
Ⅰ. 서론
Ⅱ. 문헌연구
2.1 대규모 언어 모델 학습에서의 정보유출 가능성
2.2 개인정보 보호를 위한 마스킹 기법
Ⅲ. 활용 데이터 및 마스킹 구현 방법
3.1 데이터 증강 및 전처리
3.2 KcBERT+CRF 개인정보 탐지 모델
3.3 정규식 탐지 기법
3.4 키워드 기반 탐지
Ⅳ. 모델링 결과
4.1 증강 데이터의 품질
4.2 딥러닝 모델의 성능
4.3 규칙 기반 모델 성능
4.4 하이브리드 모델 성능
Ⅴ. 결론
5.1 학문적 시사점
5.2 실무적 시사점
5.3 연구의 한계 및 추후 연구 방향성
참고문헌
Abstract