Earticle

현재 위치 Home

Session 4 : 인터넷/인트라넷과 안전

문서 분류에서 단어의 통계 정보를 이용한 특징 선택 기법의 비교
Comparison of Feature Selection Methods using the Statistics of Words in Text Categorization

첫 페이지 보기
  • 발행기관
    대한안전경영과학회 바로가기
  • 간행물
    대한안전경영과학회 학술대회논문집 바로가기
  • 통권
    1999년도 대한안전경영과학회 추계학술대회 (1999.11)바로가기
  • 페이지
    pp.209-216
  • 저자
    임윤택, 윤충화
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A157117

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

한국어
정보 검색 분야의 문서 분류에 기계 학습 기법을 적용할 때 발생하는 가장 큰 문제는 문서를 패턴으로 표현할 때, 하나의 패턴이 가지는 특징의 수가 기계 학습 기법에서 처리할 수 있는 범위를 넘어서는 것이다. 이러한 문제를 해결하기 위하여 특징 선택 기법은 패턴을 구성하고 있는 특징 중에서 실제 문서 분류에 많은 영향을 주는 특징만을 선택하여, 기계 학습 기법에서 쉽게 처리할 수 있을 정도의 패턴을 구성하게 한다. 본 논문에서는 이러한 특징 선택 기법 중에서 IG(Information Gain), Gini index, Relief-F, DF(Document Frequency)를 비교하였다. 실험 결과 문서들에 포함된 모든 고유 단어를 특징의 길이로 하여 패턴을 구성했을 때보다 특징 선택 기법을 적용하여 고유 단어 중 일부를 특징으로 패턴을 구성할 때 기계학습에서 더 향상된 분류 성능을 보였다

목차

요약
 1. 서론
 2. 특징 선택 기법
  2.1 Information Gain(lG)
  2.2 Gini
  2.3 Relief-F
  2.4 Document Frequency(DF)
 3. 학습 기법
 4. 실험 결과 및 분석
  4.1 실험 방법
  4.2 분류 성능 실험
 5. 결론
 참고문헌

저자

  • 임윤택 [ Rim Yun-Taek | 명지대학교 컴퓨터공학과 ]
  • 윤충화 [ Yoon Chung-Hwa | 명지대학교 컴퓨터공학과 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    대한안전경영과학회 [Korea Safety Management & Science]
  • 설립연도
    1999
  • 분야
    공학>안전공학
  • 소개
    안전경영에 관한 학문과 기술을 발전,보급,응용하여 안전기술 및 관리기술의 진흥에 공헌하며, 재해예방을 통한 안전사회의 구현을 그 목적으로 함.

간행물

  • 간행물명
    대한안전경영과학회 학술대회논문집
  • 간기
    부정기
  • 수록기간
    1999~2022
  • 십진분류
    KDC 530 DDC 620

이 권호 내 다른 논문 / 대한안전경영과학회 학술대회논문집 1999년도 대한안전경영과학회 추계학술대회

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장