Earticle

현재 위치 Home

지역밀착 거래 플랫폼의 제품판매정보 텍스트 분류를 활용한 개인정보 예측에 관한 연구
Model for Predicting Personal Information Exposure Using Text Classification of Product Sales Information on a Hyper-Local Transaction Platform

첫 페이지 보기
  • 발행기관
    한국전략마케팅학회 바로가기
  • 간행물
    마케팅논집 KCI 등재 바로가기
  • 통권
    제32집 제3호 통권 103호 (2024.09)바로가기
  • 페이지
    pp.61-75
  • 저자
    서상윤
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A455313

※ 기관로그인 시 무료 이용이 가능합니다.

4,800원

원문정보

초록

영어
This study aims to develop a model for diagnosing the risk of personal information exposure among users of hyper-local product transaction services. The research focuses on predicting and classifying gender information and marital status through text analysis by securing a dataset of sales posts. To achieve this, the sales post dataset was collected, and labeling for gender and marital status was performed. Latent Dirichlet Allocation (LDA) topic analysis was then used to classify the types of sales posts and identify their characteristics. Finally, a Naive Bayes model was developed to diagnose the risk of gender and marital information exposure. The data was scraped from posts on a hyper-local transaction service platform and analyzed using various packages in the R programming language for web scraping, topic analysis, and Naive Bayes analysis. The LDA topic analysis revealed that certain words frequently appeared in sales posts based on product type, allowing for the estimation of the seller's gender and marital status. Using this information, a Naive Bayes model was developed to predict the risk of exposure of the seller's gender and marital status, with a gender prediction accuracy of 74.6% and a marital status prediction accuracy of 95%. The results of this study are expected to contribute to safer transactions by identifying product types and words with high personal information exposure risk.
한국어
본 연구는 지역밀착 제품 거래서비스 이용자들의 개인정보 노출 위험을 진단하는 모형을 개발하는 것 을 목표로 수행되었다. 연구는 개인정보 노출 위험을 예측하기 위해 판매 게시글 데이터 세트를 확보 하고, 성별 정보와 혼인여부를 텍스트 분석을 통해 예측 및 분류하는 것을 중심으로 진행되었다. 이를 위해 판매글 데이터 세트를 확보하고, 성별 및 혼인여부에 대한 라벨링 작업을 수행하였다. 그리고 LDA 토픽 분석을 통해 판매글의 유형을 분류하고 그 특성을 개발하였다. 데이터는 지역밀착 거래서비 스 플랫폼에 게시된 글을 스크랩핑하여 수집되었으며, LDA 토픽 분석 결과, 제품 유형에 따라 판매자 의 성별 및 혼인여부를 추정할 수 있는 단어들이 자주 등장하는 것을 발견하였다. 이를 바탕으로 나이 브베이즈 모형을 개발하여 판매자의 성별 및 혼인여부 노출 위험을 예측한 결과, 성별 예측 정확도는 74.6%, 혼인여부 예측 정확도는 95%로 나타났다. 연구 결과는 개인정보 노출 위험이 높은 제품 유형 과 단어들을 식별하여 사용자들의 안전한 거래를 돕는 데 기여할 것으로 보인다.

목차

Ⅰ. 서 론
Ⅱ. 이론적 고찰
1. 지역기반 거래 서비스와 개인정보 노출위험
2. 텍스트 마이닝
3. LDA(Latent Dirichlet Allocation)
4. Naive Bayes Classification
Ⅲ. 연구방법
1. 연구내용
2. 연구방법
Ⅳ. 분석결과
1. 자료수집
2. 데이터 전처리
3. LDA 토픽분석
Ⅴ. 분석결과
1. 연구결과의 요약
2. 연구의 시사점 및 향후 연구방향
참고문헌
Abstract

키워드

지역밀착 거래서비스 개인정보노출 LDA 토픽분석 나이브베이즈 웹스크랩핑 Hyper-Local Transaction Services Personal Information Exposure LDA Topic Analysis Naive Bayes Web Scraping

저자

  • 서상윤 [ Sang Yun Seo | 경남대학교 경영학부 조교수 ] Corresponding author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국전략마케팅학회 [Korean Strategic Marketing Association]
  • 설립연도
    1991
  • 분야
    사회과학>경제학
  • 소개
    마케팅과 이에 관련되는 학문의 연구와 발표를 통하여 마케팅학 발전에 기여하며, 회원상호간의 침목을 도모함을 목적으로 한다. 보다 구체적으로 다음 사업을 추진한다. 1. 마케팅학의 이론과 실무에 관계된 연구 2. 회보, 회지 및 연구서적의 간행 3. 연구발표 4. 본회의 목적에 찬성하는 국내외 제학회와의 제휴 5. 본회의 목적달성에 필요한 사업 등

간행물

  • 간행물명
    마케팅논집 [Journal of Marketing Studies]
  • 간기
    계간
  • pISSN
    1229-3180
  • 수록기간
    1991~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 326 DDC 380

이 권호 내 다른 논문 / 마케팅논집 제32집 제3호 통권 103호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장