Earticle

현재 위치 Home

머신러닝을 활용한 네이버 블로그 기만 광고 감별 시스템
Machine Learning-Based Deceptive Advertisement Detection System for Naver Blogs
Machine Learning-Based Deceptive Advertisement Detection System for Naver Blogs

첫 페이지 보기
  • 발행기관
    국제문화기술진흥원 바로가기
  • 간행물
    The Journal of the Convergence on Culture Technology (JCCT) KCI 등재 바로가기
  • 통권
    Vol.12 No.1 (2026.01)바로가기
  • 페이지
    pp.455-462
  • 저자
    한유진, 변혜빈, 엄성용
  • 언어
    한국어(KOR)
  • DOI
    https://doi.org/KISTI1.1003/JNL.JAKO202605554097048
  • URL
    https://www.earticle.net/Article/A486021

※ 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

원문정보

초록

영어
Driven by the rapidly growing online advertising market, deceptive promotional blog review posts lacking disclosure of economic interests are becoming prevalent. Consumers suffer from information overload in an oversaturated market and face the difficulty of identifying hidden advertisements themselves. As deceptive ads undermine platform credibility and exacerbate consumer cognitive overload, research on machine learning-based detection methods as a countermeasure is steadily increasing. In this paper, we collected data from Naver Blog posts and built a machine learning model that automatically identifies deceptive ads using various features extracted from the posts, implementing it as a web extension. Features reflecting image OCR and structural characteristics of promotional posts showed a high correlation with ad status, and the hyperparameter-tuned model combining TF-IDF with RandomForest was determined to be the best performing model. The trained model was finally produced as a web extension to classify posts more easily and improve user experience. This System is expected to preserve consumers' cognitive resources and reduce ad fatigue during searches, and can be extended to other platforms in the future by using generalized variables compatible with other platforms.
한국어
급격히 성장 중인 온라인 광고 시장에 힘입어, 경제적 이해관계 표시를 하지 않은 기만적인 형태의 광고성 블로그 리뷰 게시글이 성행하고 있다. 소비자는 과잉 성숙 시장에서 정보과부하에 시달리며 숨겨진 광고를 직접 식별해야 하는 어려움을 겪는다. 기만 광고가 플랫폼 신뢰도를 저해하고 소비자의 인지 과부하 상태를 심화시키는 현 문제에 대한 대책으로 머신러닝 기반의 탐지 방법에 대한 연구도 꾸준히 증가하고 있다. 본 논문에서는 네이버 블로그 포스트에서 데이터를 수집하고, 포스트에서 추출한 여러 특성을 이용하여 기만 광고를 자동으로 판별하는 머신러닝 모델을 구축하여 웹 확장 프로그램 형태로 구현하였다. 이미지 OCR과 광고성 포스트의 구조 특성을 반영한 피처는 광고 여부와 높은 상관관계를 보였으며, TF-IDF 방식에 RandomForest 모델을 결합하여 하이퍼파라미터 튜닝한 모델이 가장 우수한 모형으로 판단되었다. 학습한 모델은 더 쉽게 게시글을 분류하고 사용자 경험을 향상하기 위한 웹 확장 프로그램 형태로 최종 제작되었다. 제안된 시스템은 검색 시 소비자의 인지 자원을 보호하고 광고 피로를 감소시킬 것으로 기대되며, 타 플랫폼과 1:1 대응 가능한 일반화된 변수를 사용하여 추후 다른 플랫폼으로 확대 적용할 수 있을 것이다.

저자

  • 한유진 [ Yu jin Han ]
  • 변혜빈 [ Hye Been Byeon ]
  • 엄성용 [ Seong Yong Ohm ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    국제문화기술진흥원 [The International Promotion Agency of Culture Technology]
  • 설립연도
    2009
  • 분야
    공학>공학일반
  • 소개
    본 진흥원은 문화기술(Culture Technology) 관련 산·학·연·관으로 구성된 비영리 단체이다. 문화기술(CT)은 정보통신기술(ICT), 문화적 사고 기반의 예술, 인문학, 디자인, 사회과학기술이 접목된 신융합기술(New Convergence Technology, NCT)로 정의한다. 인간의 삶의 질을 향상시키고, 진보된 방향으로 변화시키고, 문화기술 관련 분야의 학술 및 기술의 발전과 진흥에 공헌하기 위하여, 제3조의 필요한 사업을 행함을 그 목적으로 한다.

간행물

  • 간행물명
    The Journal of the Convergence on Culture Technology (JCCT) [문화기술의 융합]
  • 간기
    격월간
  • pISSN
    2384-0358
  • eISSN
    2384-0366
  • 수록기간
    2015~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 600 DDC 700

이 권호 내 다른 논문 / The Journal of the Convergence on Culture Technology (JCCT) Vol.12 No.1

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장