Recently, bit data is difficult to easily collect the desired data because big data is collected via the Internet. Big data is higher than the rate at which the data type and the period of time for which data is collected depending on the size of data increases. In particular, since the data of all different by the intended use and the type of data processing accuracy and computational cost is one of the important items. In this paper, we propose data processing method using a dual-chain in a manner to minimize the computational cost of the data when data is correctly extracted at the same time a multi-layered process through the desired number of the user and different kinds of data on the Internet. The proposed scheme is classified into a hierarchical data in accordance with the intended use and method to extract various kinds of data. At this time, multi-processing and tie the data hash with the double chain to enhance the accuracy of the reading. In addition, the proposed method is to organize the data in the hash chain for easy access to the hierarchically classified data and reduced the cost of processing the data. Experimental results, the proposed method is the accuracy of the data on average 7.8% higher than conventional techniques, processing costs were reduced by 4.9% of the data.
한국어
현재 인터넷을 통해 수집되는 빅 데이터는 데이터의 종류와 크기에 따라 데이터가 수집되는 시간보다 데이터가 증가하는 속도가 높아 사용자가 원하는 데이터를 원활하게 수집하는 것이 어려운 상황이다. 특히, 데이터의 사용 목적 및 종류에 따라 다르게 처리되기 때문에 데이터의 정확성과 계산비용이 빅 데이터 관리에 중요한 항목 중 하나이다. 본 논문에서는 인터넷에 존재하는 수많은 서로 다른 종류의 데이터를 사용자가 원할 때, 데이터를 정확하게 추출하는 동시에 데이터의 계산비용을 최소화하기 위해서 이중 해쉬체인을 이용한 계층적 다중처리 기반의 데이터 처리기법을 제안한다. 제안 기법은 다양한 종류의 데이터를 추출하기 위해서 데이터를 사용 목적 및 방법에 따라 계층적으로 분류한다. 이때, 데이터의 정확도를 높이기 위해서 데이터를 이중 해쉬체인으로 묶어 다중 처리한다. 또한, 제안 기법은 계층적으로 분류된 데이터를 손쉽게 접근하기 위해서 해쉬체인으로 데이터를 구성하여 데이터의 처리 비용을 줄였다. 실험결과, 제안 기법은 기존 기법보다 데이터의 정확도는 평균 7.8% 높았고, 데이터의 처리 비용은 4.9% 단축시켰다.
목차
요약 Abstract 1. 서론 2. 관련연구 2.1 빅데이터 2.2 기존 연구 3. 계층적 해쉬체인 기반 데이터 추출기법 3.1 개요 3.2 용어 정의 3.3 해쉬 체인 기반 계층적 구조의 데이터추출 기법 4. 성능 평가 4.1 환경설정 4.2 성능분석 5. 결론 REFERENCES
키워드
빅 데이터데이터 관리이중 해쉬체인계층적 다중 처리데이터 정확성Big DataData ManagementDouble Hash ChainHierarchical Multi-processingData Accuracy
저자
정윤수 [ Yoon-Su Jeong | 목원대학교 정보통신융합공학부 ]
김용태 [ Yong-Tae Kim | 한남대학교 멀티미디어학부 ]
Corresponding Author
한국디지털정책학회 [The Society of Digital Policy & Management]
설립연도
2003
분야
복합학>과학기술학
소개
디지털기술 및 산업정책, 디지털경제, 관련 산업의 연구, 전자정부, 디지털정치에 관한 제도적, 정책적 연구, 디지털경영, 전자상거래, e-비즈니스에 관한 실용적 연구, 학술연구지 발간 및 학술대회 개최 등을 통하여 디지털경제 및 디지털경영에 관련되는 국가정책 분야의 연구 및 교류를 촉진하고 국가 및 기업 정보화와 디지털산업의 발전에 공헌한다.