This paper analyzes the shortcomings of traditional hidden Markov crawler, makes some improvements on the clustering strategy of web pages and the judgment algorithm for determining the correlation of pages or hyperlinks with the topic; and brings forward an AHMM (Adaptive Hidden Markov Model) modeling method. The experimental results shows that the improved AHMM is much more efficient than the traditional HMM.
목차
Abstract 1. Introduction 2. The Shortcomings of Traditional HMM Crawler 3. The Overall Framework of HMM Crawler 4. Training Set Page Clustering Strategy of AHMM Crawler 5. The Selection Method of AHMM Crawler for the Page to be Collected 5.1. Judgment on the Correlation Degree Between the Page and the Topic 5.2. Judgment on the Correlation Degree Between URLs and the Topic 6. HMM Modeling in AHMM Crawlers 7. Implementation and Experimental Analysis 7.1. The HMM Training 7.2. The HMM Path Prediction 7.3. Experimental Analysis 8. Conclusion References
키워드
net-mediated public sentimenthidden Markovweb crawler
저자
Hailong Jia [ Wuhan University of Technology, Wuhan 430063, China ]
Lina Fang [ Xinxiang University, Xinxiang 453000, China ]
보안공학연구지원센터(IJUNESST) [Science & Engineering Research Support Center, Republic of Korea(IJUNESST)]
설립연도
2006
분야
공학>컴퓨터학
소개
1. 보안공학에 대한 각종 조사 및 연구
2. 보안공학에 대한 응용기술 연구 및 발표
3. 보안공학에 관한 각종 학술 발표회 및 전시회 개최
4. 보안공학 기술의 상호 협조 및 정보교환
5. 보안공학에 관한 표준화 사업 및 규격의 제정
6. 보안공학에 관한 산학연 협동의 증진
7. 국제적 학술 교류 및 기술 협력
8. 보안공학에 관한 논문지 발간
9. 기타 본 회 목적 달성에 필요한 사업
간행물
간행물명
International Journal of u- and e- Service, Science and Technology
간기
격월간
pISSN
2005-4246
수록기간
2008~2016
십진분류
KDC 505DDC 605
이 권호 내 다른 논문 / International Journal of u- and e- Service, Science and Technology Vol.9 No.8