빅데이터 처리시간 감소와 저장 효율성이 향상을 위한 맵리듀스 기반 빅데이터 처리 기법 구현

빅데이터 처리시간 감소와 저장 효율성이 향상을 위한 맵리듀스 기반 빅데이터 처리 기법 구현
Implement of MapReduce-based Big Data Processing Scheme for Reducing Big Data Processing Delay Time and Store Data

간행물

한국융합학회논문지 KCI 등재 바로가기
권호(발행년)

제9권 제10호 (2018.10) 바로가기
페이지

pp.13-19
저자

이협건, 김영운, 김기영
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A339292

원문정보

초록

한국어: 맵리듀스는 하둡의 필수 핵심 기술로 하둡 분산 파일 시스템을 기반으로 빅데이터를 처리하는 가장 보편화되어 사용되고 있다. 그러나 기존 맵리듀스 기반 빅데이터 처리 기법은 하둡 분산 파일 시스템에 정해진 블록의 크기대로 파일 나눠 저장되는 특징으로 인해 인프라 자원의 낭비가 극심하다. 이에 본 논문에서는 효율적인 맵리듀스 기반 빅데이터 처리 기법을 제안한다. 제안하는 기법은 처리할 데이터를 사전에 맵리듀스에서 처리하기 적합한 데이터 형태로 변환 및 압축하여 빅데이터 인프라 환경의 저장 효율성을 증가시킨다. 또한 제안하는 기법은 저장 효율성을 중점으로 구현했을 때 발생할 수 있는 데이터 처리 시간의 지연 문제를 해결한다.

영어: MapReduce, the Hadoop's essential core technology, is most commonly used to process big data based on the Hadoop distributed file system. However, the existing MapReduce-based big data processing techniques have a feature of dividing and storing files in blocks predefined in the Hadoop distributed file system, thus wasting huge infrastructure resources. Therefore, in this paper, we propose an efficient MapReduce-based big data processing scheme. The proposed method enhances the storage efficiency of a big data infrastructure environment by converting and compressing the data to be processed into a data format in advance suitable for processing by MapReduce. In addition, the proposed method solves the problem of the data processing time delay arising from when implementing with focus on the storage efficiency.

요약
Abstract
1. 서론
2. 관련연구
  2.1 맵리듀스
  2.2 맵리듀스 기반 빅데이터 처리 기법
  2.3 요구사항 분석
3. 제안하는 빅데이터 처리 기법
  3.1 빅데이터 변환 단계
  3.2 빅데이터 재생성 단계
4. 성능평가
  4.1 데이터 저장 용량 효율성 분석
  4.2 빅데이터 처리 시간 분석
5. 결론
REFERENCES

저자

이협건 [ Hyeopgeon Lee | 한국폴리텍대학 서울강서캠퍼스 데이터분석과 교수 ] Corresponding author
김영운 [ Young-Woon Kim | 한국폴리텍대학 서울강서캠퍼스 데이터분석과 교수 ]
김기영 [ Ki-Young Kim | 서일대학교 소프트웨어공학과 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

간행물

한국융합학회논문지 [Journal of the Korea Convergence Society]
간기
월간
pISSN
2233-4890
수록기간
2010~2022
십진분류
KDC 530 DDC 620

Earticle

빅데이터 처리시간 감소와 저장 효율성이 향상을 위한 맵리듀스 기반 빅데이터 처리 기법 구현
Implement of MapReduce-based Big Data Processing Scheme for Reducing Big Data Processing Delay Time and Store Data

원문정보

초록

목차

저자

참고문헌

간행물 정보

Earticle

빅데이터 처리시간 감소와 저장 효율성이 향상을 위한 맵리듀스 기반 빅데이터 처리 기법 구현 Implement of MapReduce-based Big Data Processing Scheme for Reducing Big Data Processing Delay Time and Store Data

원문정보

초록

목차

저자

참고문헌

간행물 정보

빅데이터 처리시간 감소와 저장 효율성이 향상을 위한 맵리듀스 기반 빅데이터 처리 기법 구현
Implement of MapReduce-based Big Data Processing Scheme for Reducing Big Data Processing Delay Time and Store Data