Earticle

현재 위치 Home

논문

Hadoop 기반의 그래프 분석을 위한 간선 분할 기법
Edge partitioning technique for graph analysis on Hadoop

첫 페이지 보기
  • 발행기관
    한국차세대컴퓨팅학회 바로가기
  • 간행물
    한국차세대컴퓨팅학회 논문지 KCI 등재 바로가기
  • 통권
    Vol.8 No.6 (2012.12)바로가기
  • 페이지
    pp.17-26
  • 저자
    최동훈, 엄정호, 윤화묵, 최윤수, 이민호, 이원구, 송사광, 정한민, 이명호
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A189840

원문정보

초록

영어
Partitioning of a large scale graph based on traditional graph partitioning algorithm is very effective in improving the performance of application processing on Hadoop. Due to the cost of partitioning, this method drastically reduces the performance benefit. In this paper, we propose a graph partitioning technique using semi-clustering to reduce the cost of graph partitioning and enhance the performance benefit. We also show that our partitioning technique is effective in computing PageRank of a web graph created from Wikipedia. Proposed partitioning technique surpasses the cost of semi-clustering and improves the performance of PageRank computation by more than 15 % on Hadoop cluster.
한국어
Hadoop을 이용하여 대규모 그래프를 처리할 때, 전통적인 그래프 분할 알고리즘에 의한 대규모 그래프의 분할은 성능 개선에 효과적이지만, 분할 알고리즘의 실행 비용은 성능 개선으로 인한 이익을 상당히 감소시킨다. 본 논문에서는 대규모 그래프의 분할 비용을 줄이면서 성능 개선 효과를 높이기 위한 그래프 분할 기법으로, 준클러스터링에 의한 간선 분할 기법을 제안한다. 아울러, 위키피디아로부터 생성된 웹 그래프와 PageRank 알고리즘를 이용하여 그래프 분할 기법의 성능 개선 효과를 분석한다. 준클러스터링에 의한 분할 기법은 Hadoop 클러스터에서 그래프 분할 비용을 제하고도 15% 정도의 성능 개선 효과를 나타내고 있다.

목차

요약
 Abstract
 1. 서론
 2. 관련연구
  2.1 그래프 병렬 처리 모델
  2.2 Hadoop의 그래프 분할 기법
  2.3 페이지랭크 알고리즘
 3. 준클러스터링에 의한 그래프의 간선 분할
  3.1 정점의 외향 차수 계산
  3.2 준클러스터의 생성
  3.3 데이터 파티션에 준클러스터의 할당
 4. 성능 평가
  4.1 실험 환경
  4.2 준클러스터링에 의한 PageRank의 성능 개선 효과
  4.3 메모리 크기가 페이지 랭크 실행 시간에 미치는 영향
 5. 결론
 참고문헌

키워드

대규모 그래프 처리 준클러스터링 그래프 분할 웹 그래프 분석 Hadoop Hadoop large scale graph processing semi-clustering graph partitioning web graph analysis

저자

  • 최동훈 [ Dong Hoon Choi | 한국과학기술정보연구원 정보소프트웨어센터 ]
  • 엄정호 [ Jung-Ho Um | 한국과학기술정보연구원 정보소프트웨어센터 ] 교신저자
  • 윤화묵 [ Hwa Mook Yoon | 한국과학기술정보연구원 정보소프트웨어센터 ]
  • 최윤수 [ Yun-Soo Choi | 한국과학기술정보연구원 정보소프트웨어센터 ]
  • 이민호 [ Min Ho Lee | 한국과학기술정보연구원 정보소프트웨어센터 ]
  • 이원구 [ Won-Goo Lee | 한국과학기술정보연구원 정보소프트웨어센터 ]
  • 송사광 [ Sa-kwang Song | 한국과학기술정보연구원 정보소프트웨어센터 ]
  • 정한민 [ Hanmin Jung | 한국과학기술정보연구원 정보소프트웨어센터 ]
  • 이명호 [ Myungho Lee | 명지대학교 컴퓨터공학과 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • 설립연도
    2005
  • 분야
    공학>컴퓨터학
  • 소개
    본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

  • 간행물명
    한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]
  • 간기
    격월간
  • pISSN
    1975-681X
  • 수록기간
    2005~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.8 No.6

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장