Earticle

현재 위치 Home

분류 성능 향상을 위한 비감독학습 기반의 패턴 선택
Pattern Selection based on Unsupervised Learning for Improving the Performance of Classification

첫 페이지 보기
  • 발행기관
    국제인공지능학회(구 한국인터넷방송통신학회) 바로가기
  • 간행물
    한국인터넷방송통신학회 논문지 KCI 등재후보 바로가기
  • 통권
    제7권 제2호 (2007.04)바로가기
  • 페이지
    pp.19-25
  • 저자
    김만선, 주복규
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A73610

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

원문정보

초록

영어
Pattern selection algorithms are to select some useful patterns from all learning patterns and use them as training patters. Useful pattern is a pattern that contributes much to the learning. For classification problems, useful patters are those near class boundary or class center. Noise patterns will decrease the performance of classification model. In this paper, we propose a pre-processing technique to eliminate those noise patterns. This is based on un-supervised learning technique, which is different from traditional sampling techniques. We will have several benefits when model is learned from useful patterns only: decrease in both computation time and space requirements while learning as well as the decrease of class imbalance. To show the effectiveness of proposed techniques, we applied it to one synthetic data set and two real-world benchmark data sets. For the breast cancer case, we achieved the increase of all of precision, recall, and F1 values even if data set is reduced to less than 50%.
한국어
패턴 선택은 주어진 전체 학습 패턴으로부터 일부 유용한 패턴들을 추출하여 학습에 이용하는 방법이다. 분류 문제에서 유용한 학습패턴은 클래스들 간의 분류경계에 근접하거나 클래스의 중심 부근에 속한 패턴을 정상패턴이라고 한다. 이러한 패턴 중에서 노이즈 패턴이 포함된다면 분류 모델의 성능을 저하시킨다. 제안하는 방법은 노이즈를 제거하는 일종의 전처리 작업으로서 기존의 샘플링 방법을 사용하지 않고, 비감독 학습을 도입하여 노이즈 데이터를 제거한다. 그 결과 선택된 데이터로 학습할 경우, 학습 데이터 수 감소로 인한 계산 시간 단축 및 메모리 공간 절약의 효과 그리고 클래스 불균형 문제에서 불균형 비율을 감소시키는 효과가 있다. 제안하는 방법의 효율성을 알아보기 위하여 인공 데이터와 실제 문제에 적용하였다. 적용 결과 breast cancer 데이터는 전체 데이터수의 54%를 제거하였어도 정확률, 재현율, F1 값이 모두 향상되었다.

목차

요약
 Abstract
 Ⅰ. 서론
 Ⅱ. 관련 연구
  1. 데이터의 분포와 속성에 의한 방법
  2. 샘플링에 의한 방법
 Ⅲ. SOM 기반의 개선된 샘플링 기법
  1. 패턴 점수 기반의 새로운 훈련 집합 획득
 Ⅳ. 실험 및 결과
  1. 인공 데이터 실험
  2. 실제 데이터 실험
 Ⅴ. 결론
 참고문헌

키워드

Pattern Selection Data Mining Classification Sampling SOM

저자

  • 김만선 [ Man-Sun Kim | 정회원, 전남대학교 전산학과 ]
  • 주복규 [ Bok-Gyu Joo | 종신회원, 홍익대학교 정보통신공학과 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    국제인공지능학회(구 한국인터넷방송통신학회) [The International Association for Artificial Intelligence]
  • 설립연도
    2000
  • 분야
    공학>전자/정보통신공학
  • 소개
    인터넷방송, 인터넷 TV , 방송 통신 네트워크 및 관련 분야에 대한 국내는 물론 국제적인 학술, 기술의 진흥발전에 공헌하고 지식 정보화 사회에 기여하고자 한다.

간행물

  • 간행물명
    한국인터넷방송통신학회 논문지 [The Journal of the Institute of Internet, Broadcasting and Communication]
  • 간기
    격월간
  • pISSN
    2289-0238
  • eISSN
    2289-0246
  • 수록기간
    2001~2025
  • 십진분류
    KDC 326 DDC 380

이 권호 내 다른 논문 / 한국인터넷방송통신학회 논문지 제7권 제2호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장