Earticle

현재 위치 Home

댓글 스팬 강도 임계값을 활용한 공격성 탐지와 플랫폼 구성 편향 진단
Span-Intensity Thresholds for Comment Toxicity Detection and Bias Diagnosis
Span-Intensity Thresholds for Comment Toxicity Detection and Bias Diagnosis

첫 페이지 보기
  • 발행기관
    국제문화기술진흥원 바로가기
  • 간행물
    The Journal of the Convergence on Culture Technology (JCCT) KCI 등재 바로가기
  • 통권
    Vol.12 No.1 (2026.01)바로가기
  • 페이지
    pp.309-316
  • 저자
    조윤용, 김현아
  • 언어
    한국어(KOR)
  • DOI
    https://doi.org/KISTI1.1003/JNL.JAKO202605461262917
  • URL
    https://www.earticle.net/Article/A486009

※ 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

원문정보

초록

영어
Aggressive comments continue to rise across digital platforms, yet prior work has not sufficiently captured the intensity of aggression within a comment. This study quantifies toxic-span length and proportion using the KHS and K-MHaS corpora and proposes a span-intensity thresholding method that flags high-intensity comments at the top 5% and 10%. Results show that news comments exhibit aggression more frequently but with lower intensity, whereas YouTube comments occur less often but with higher intensity, indicating that a single global threshold can induce platform-specific concentration. Logistic analysis identifies comment types and targets that appear more often in the high-intensity set, while within-platform thresholds reduce these disparities. A lightweight GBDT model achieves stable predictive performance (AUC ≈ 0.65, PR-AP ≈ 0.64, Brier ≈ 0.249) without semantic features, supporting practical deployment. The findings demonstrate that span-intensity thresholds improve high-risk comment detection and enable fairness-aware monitoring tailored to platform characteristics.
한국어
디지털 플랫폼 환경에서 공격적 댓글은 증가하고 있으나, 기존 연구는 댓글 안에서 공격성이 얼마나 강하게 나타나는지 충분히 다루지 못했다. 이에 본 연구는 KHS와 K-MHaS 코퍼스를 이용해 댓글 속 공격 구간의 길이와 비율을 계산하고, 이를 바탕으로 상위 5%, 10%의 고강도 댓글을 자동으로 걸러내는 방법을 제안한다. 분석 결과, 뉴스 댓글은 공격 표현이 자주 나타나지만 강도는 상대적으로 약했고, 유튜브 댓글은 빈도는 낮지만 강도는 높아 같은 기준을 적용하면 한 플랫폼으로 플래그가 집중될 수 있음을 확인하였다. 로지스틱 분석에서는 일부 유형과 대상이 고강도 댓글에 더 자주 포함되는 경향이 나타났으며, 플랫폼 내부 기준을 적용하면 이러한 차이가 완화되었다. 또한 경량 GBDT 모델은 텍스트 의미 정보를 사용하지 않고도 AUC≈0.65, PR-AP≈0.64, Brier≈0.249 수준의 안정적인 예측력을 보여 실무에서 활용 가능성이 높았다. 본 연구는 스팬 강도 기반 임계값을 통해 고위험 댓글을 더 정확하게 찾고, 플랫폼별 형평성을 고려한 모니터링 체계를 설계할 수 있음을 제시한다.

저자

  • 조윤용 [ Yoon Yong Cho ]
  • 김현아 [ Hyun-Ah Kim ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    국제문화기술진흥원 [The International Promotion Agency of Culture Technology]
  • 설립연도
    2009
  • 분야
    공학>공학일반
  • 소개
    본 진흥원은 문화기술(Culture Technology) 관련 산·학·연·관으로 구성된 비영리 단체이다. 문화기술(CT)은 정보통신기술(ICT), 문화적 사고 기반의 예술, 인문학, 디자인, 사회과학기술이 접목된 신융합기술(New Convergence Technology, NCT)로 정의한다. 인간의 삶의 질을 향상시키고, 진보된 방향으로 변화시키고, 문화기술 관련 분야의 학술 및 기술의 발전과 진흥에 공헌하기 위하여, 제3조의 필요한 사업을 행함을 그 목적으로 한다.

간행물

  • 간행물명
    The Journal of the Convergence on Culture Technology (JCCT) [문화기술의 융합]
  • 간기
    격월간
  • pISSN
    2384-0358
  • eISSN
    2384-0366
  • 수록기간
    2015~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 600 DDC 700

이 권호 내 다른 논문 / The Journal of the Convergence on Culture Technology (JCCT) Vol.12 No.1

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장