Earticle

현재 위치 Home

논문

웹 페이지 컨텐츠 점수를 이용한 개선된 페이지랭크 알고리즘
An Extended Page Rank Algorithm using Web Page Contents Score

첫 페이지 보기
  • 발행기관
    한국차세대컴퓨팅학회 바로가기
  • 간행물
    한국차세대컴퓨팅학회 논문지 KCI 등재후보 바로가기
  • 통권
    Vol.6 No.3 (2010.06)바로가기
  • 페이지
    pp.12-19
  • 저자
    김태원, 나연묵
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A122566

원문정보

초록

영어
Recently, the Web developed as the media which offers and sharers more information thanks to the rapid progress in web technology. Consequently, a lot of methods are being studied in order to improve the quality of search in web searches. Of these, as the core algorithm of Google search engine, Page Rank algorithm is known to effectively rank. However, existing page rank algorithm is performing using only the number of links. This paper suggests the efficient algorithm that reflects not only the number of links but also the contents score of web page. To achieve this ,the paper introduces the scoring technique of contents in web page and proposes two improved algorithm that has an effect on the score of links. It shows that, proposed algorithm more effectively reflects the contents score of web page than established page rank algorithm through a comparative experimental study on each algorithm.
한국어
최근 웹 검색 분야에서 검색의 질을 높이기 위한 기법들이 많이 연구되고 있다. 페이지랭크 알고리즘은 구글 검색엔진의 핵심 알고리즘으로써 웹 문서들을 효과적으로 랭킹하는 것으로 알려져 있다. 그러나 기존의 페이지랭크 알고리즘은 링크의 수만을 이용하여 랭킹을 수행하고 있다. 본 논문에서는 단순히 링크의 수뿐만 아니라 웹 페이지의 컨텐츠에 대한 점수를 랭킹에 반영하는 효율적인 알고리즘을 제시한다. 이를 위하여 웹 페이지의 컨텐츠를 점수화하는 기법을 소개하고 링크의 점수에 영향을 주는 2가지의 개선된 알고리즘을 제시한다. 비교 실험을 통해 제안 알고리즘이 기존의 페이지랭크 알고리즘 보다 웹 페이지의 컨텐츠의 점수를 효율적으로 반영함을 보인다.

목차

요약
 Abstract
 1. 서론
 2. 관련연구
 3. 웹 페이지의 본문 컨텐츠를 점수화하는 방법
  3.1 웹 페이지 본문 컨텐츠 점수 도입 배경
  3.2 본문 컨텐츠를 점수화하는 방법
  3.3 표준오차의 도입과 스케일 변환
 4. 개선알고리즘
  4.1 PR-S: 웹 페이지의 점수를 반영하는 링크의점수로 개선된 알고리즘
  4.2 PR-WS: 분산되는 링크에 점수에 따른 차별방식으로 개선된 알고리즘
 5. 실험
  5.1 실험설정
  5.2 가상의 데이터에 대한 기존 알고리즘 실험결과
  5.3 개선된 알고리즘 적용된 실험
  5.4 보다 복잡한 가상데이터의 실험
 5. 결론 및 향후 연구 계획
 참고문헌

키워드

웹검색 페이지 랭크 김태원 Web Search Page Rank TaewonKim

저자

  • 김태원 [ Taewon Kim | 단국대학교 컴퓨터학부 ]
  • 나연묵 [ Younmook Nah | 단국대학교 컴퓨터학부 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • 설립연도
    2005
  • 분야
    공학>컴퓨터학
  • 소개
    본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

  • 간행물명
    한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]
  • 간기
    격월간
  • pISSN
    1975-681X
  • 수록기간
    2005~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.6 No.3

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장