Earticle

다운로드

하둡 환경에 적합한 클러스터 그룹 기반 속성 정보를 이용한 빅 데이터 관리 기법
Big Data Management Scheme using Property Information based on Cluster Group in adopt to Hadoop Environment

  • 간행물
    디지털융복합연구 KCI 등재 바로가기
  • 권호(발행년)
    제13권 제9호 (2015.09) 바로가기
  • 페이지
    pp.235-242
  • 저자
    한군희, 정윤수
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A253846

원문정보

초록

한국어
소셜 네트워크 기술이 발달하면서 빅 데이터 서비스에 대한 관심이 증가하고 있다. 그러나, 중앙 서버가 아 닌 분산 서버에 저장된 데이터를 손쉽게 검색 및 추출하기 위한 기술은 부족한 실정이다. 본 논문에서는 빅 데이터 서비스를 제공하는 컨텐츠 서버와 관리 서버에서 사용자가 원하는 정보의 처리시간을 최소화하기 위한 빅 데이터 관 리 기법을 제안하다. 제안 기법은 빅 데이터의 종류, 기능, 특성에 따라 데이터를 그룹으로 분류한 후 분류된 그룹 내 데이터를 속성정보와 연계하여 해쉬체인에 적용한다. 또한, 분산 서버에 저장된 데이터를 최단 시간에 추출하기 위해서 데이터 인덱스 정보(DII, Data Index Information)를 그룹화하여 데이터에 부여된 다중의 속성 정보를 분류하 여 데이터의 처리 속도를 향상시킨다. 실험 결과, 클러스터 그룹 수에 따른 데이터의 평균 검색 시간은 평균 14.6% 향상되었고, 키워드 수에 따른 데이터 처리시간은 평균 13% 단축되었다.
영어
Social network technology has been increasing interest in the big data service and development. However, the data stored in the distributed server and not on the central server technology is easy enough to find and extract. In this paper, we propose a big data management techniques to minimize the processing time of information you want from the content server and the management server that provides big data services. The proposed method is to link the in-group data, classified data and groups according to the type, feature, characteristic of big data and the attribute information applied to a hash chain. Further, the data generated to extract the stored data in the distributed server to record time for improving the data index information processing speed of the data classification of the multi-attribute information imparted to the data. As experimental result, The average seek time of the data through the number of cluster groups was increased an average of 14.6% and the data processing time through the number of keywords was reduced an average of 13%.

목차

요약
 Abstract
 1. 서론
 2. 관련연구
  2.1 하둡 시스템
  2.2 기존 연구
 3. 클러스터 기반 속성 정보를 통한 빅 데이터 관리기법
  3.1 개요
  3.2 용어 정의
  3.3 해쉬 체인 기반 분산 환경의 데이터처리 기법
 4. 성능 평가
  4.1 평균 정보 검색 시간
  4.2 키워드 수에 따른 데이터 처리시간
  4.3 데이터 인덱스 크기에 따른 오버헤드
 5. 결론
 REFERENCES

저자

  • 한군희 [ Kun-Hee Han | 백석대학교 정보통신공학과 ]
  • 정윤수 [ Yoon-Su Jeong | 목원대학교 정보통신융합공학부 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

    간행물 정보

    • 간행물
      디지털융복합연구 [Journal of Digital Convergence]
    • 간기
      계간
    • pISSN
      2713-6434
    • eISSN
      2713-6442
    • 수록기간
      2003~2026
    • 등재여부
      KCI 등재후보
    • 십진분류
      KDC 569 DDC 620