Data mining technology is a powerful tool to solve the problem. It is widely used to identify potentially useful information. Fuzzy principle based fuzzy C- means is a modification of commonly used C- means clustering technique. In the paper, a modified fuzzy C-means algorithm is used in the gene sequence. The modification is through taking a pseudo F statistics into the method. In the simulation, we use nodes instead of gene to verify the validity. According to the simulation, we get the optimal cluster number, the structure of the classification of the nodes. In order to test the performance of the algorithm, it has been used to process large amount of data, and results show that it has higher processing speed and stable performance. The algorithm can be used in the gene description.
목차
Abstract 1. Introduction 2. Data Mining 2.1 Main Methods 2.2 The Basic Process of Data Mining 3. Clustering Algorithm 4. Modified Clustering Algorithm 4.1 Discriminant Function 4.2 Clustering Algorithm 5. Analysis of Simulation Results 6. Conclusions References
키워드
bioinformationfuzzy C-meansdata mininggene
저자
Yang Zaihua [ College of technology, Xi'an International University, 710077, Xi’an Shaanxi China ]
보안공학연구지원센터(IJHIT) [Science & Engineering Research Support Center, Republic of Korea(IJHIT)]
설립연도
2006
분야
공학>컴퓨터학
소개
1. 보안공학에 대한 각종 조사 및 연구
2. 보안공학에 대한 응용기술 연구 및 발표
3. 보안공학에 관한 각종 학술 발표회 및 전시회 개최
4. 보안공학 기술의 상호 협조 및 정보교환
5. 보안공학에 관한 표준화 사업 및 규격의 제정
6. 보안공학에 관한 산학연 협동의 증진
7. 국제적 학술 교류 및 기술 협력
8. 보안공학에 관한 논문지 발간
9. 기타 본 회 목적 달성에 필요한 사업
간행물
간행물명
International Journal of Hybrid Information Technology
간기
격월간
pISSN
1738-9968
수록기간
2008~2016
십진분류
KDC 505DDC 605
이 권호 내 다른 논문 / International Journal of Hybrid Information Technology Vol.8 No.6