Earticle

현재 위치 Home

K-means 알고리즘 기반 클러스터링 인덱스 비교 연구
A Performance Comparison of Cluster Validity Indices based on K-means Algorithm

첫 페이지 보기
  • 발행기관
    한국경영정보학회 바로가기
  • 간행물
    Asia Pacific Journal of Information Systems KCI 등재 바로가기
  • 통권
    제16권 제1호 (2006.03)바로가기
  • 페이지
    pp.127-144
  • 저자
    심요성, 정지원, 최인찬
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A90882

※ 기관로그인 시 무료 이용이 가능합니다.

5,200원

원문정보

초록

영어
The K-means algorithm is widely used at the initial stage of data analysis in data mining process, partly because of its low time complexity and the simplicity of practical implementation. Cluster validity indices are used along with the algorithm in order to determine the number of clusters as well as the clustering results of datasets. In this paper, we present a performance comparison of sixteen indices, which are selected from forty indices in literature, while considering their applicability to nonhierarchical clustering algorithms. Data sets used in the experiment are generated based on multivariate normal distribution. In particular, four error types including standardization, outlier generation, error perturbation, and noise dimension addition are considered in the comparison. Through the experiment the effects of varying number of points, attributes, and clusters on the performance are analyzed. The result of the simulation experiment shows that Calinski and Harabasz index performs the best through the all datasets and that Davis and Bouldin index becomes a strong competitor as the number of points increases in dataset.

목차

I. 서론
 II. 클러스터링 알고리즘과 인덱스
  2.1 비계층형 클러스터링 알고리즘
  2.2 클러스터링 인덱스
 III. 실험 및 결과
  3.1 시뮬레이션 데이터 생성 기법
  3.2 기본실험
  3.3 확장실험
 IV. 결론 및 향후 연구 방향
 참고문헌

키워드

Data Mining Cluster Analysis Nonhierarchical Clustering K-means Cluster Validity Index

저자

  • 심요성 [ Yo-Sung Shim | 고려대학교 산업시스템정보공학과 석사과정 ]
  • 정지원 [ Ji-Won Chung | 고려대학교 산업시스템정보공학과 박사과정 ]
  • 최인찬 [ In-Chan Choi | 고려대학교 산업시스템정보공학과 교수 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국경영정보학회 [The Korea Society of Management information Systems]
  • 설립연도
    1989
  • 분야
    사회과학>경영학
  • 소개
    이 학회는 경영정보학의 연구 및 교류를 촉진하고 학문의 발전과 응용에 공헌함을 목적으로 합니다.

간행물

  • 간행물명
    Asia Pacific Journal of Information Systems
  • 간기
    계간
  • pISSN
    2288-5404
  • eISSN
    2288-6818
  • 수록기간
    1990~2026
  • 등재여부
    KCI 등재,SCOPUS
  • 십진분류
    KDC 325 DDC 658

이 권호 내 다른 논문 / Asia Pacific Journal of Information Systems 제16권 제1호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장