쿠쿠 필터 유사도를 적용한 다중 필터 분산 중복 제거 시스템 설계 및 구현

김영아; 김계희; 김현주; 김창근

216.73.216.25

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

쿠쿠 필터 유사도를 적용한 다중 필터 분산 중복 제거 시스템 설계 및 구현
Design and Implementation of Multiple Filter Distributed Deduplication System Applying Cuckoo Filter Similarity

발행기관

중소기업융합학회 바로가기
간행물

융합정보논문지(구 중소기업융합학회논문지) KCI 등재 바로가기
통권

제10권 제10호 (2020.10)바로가기
페이지

pp.1-8
저자

김영아, 김계희, 김현주, 김창근
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A383111

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어: The need for storage, management, and retrieval techniques for alternative data has emerged as technologies based on data generated from business activities conducted by enterprises have emerged as the key to business success in recent years. Existing big data platform systems must load a large amount of data generated in real time without delay to process unstructured data, which is an alternative data, and efficiently manage storage space by utilizing a deduplication system of different storages when redundant data occurs. In this paper, we propose a multi-layer distributed data deduplication process system using the similarity of the Cuckoo hashing filter technique considering the characteristics of big data. Similarity between virtual machines is applied as Cuckoo hash, individual storage nodes can improve performance with deduplication efficiency, and multi-layer Cuckoo filter is applied to reduce processing time. Experimental results show that the proposed method shortens the processing time by 8.9% and increases the deduplication rate by 10.3%.

한국어: 최근 몇 년 동안 기업이 수행하는 비즈니스 활동에서 생성된 데이터를 기반으로 하는 기술이 비즈니스 성공의 열쇠로 부상함에 따라 대체 데이터에 대한 저장, 관리 및 검색 기술에 대한 필요성이 대두되었다. 기존 빅 데이터 플랫폼 시스템은 대체 데이터인 비정형 데이터를 처리하기 위해 실시간으로 생성된 대량의 데이터를 지체 없이 로드하고 중복 데이터 발생 시 서로 다른 스토리지의 중복 제거 시스템을 활용하여 스토리지 공간을 효율적으로 관리해야 한다. 본 논문 에서는 빅 데이터의 특성을 고려하여 쿠쿠 해싱 필터 기법의 유사도를 이용한 다중 계층 분산 데이터 중복 제거 프로세스 시스템을 제안한다. 가상 머신 간의 유사성을 쿠쿠 해시로 적용함으로써 개별 스토리지 노드는 중복 제거 효율성으로 성능 을 향상시키고 다중 레이어 쿠쿠 필터를 적용하여 처리 시간을 줄일 수 있다. 실험 결과 제안한 방법은 기존 블룸 필터를 이용한 중복 제거 기법에 의해 8.9%의 처리 시간 단축과 중복 제거율이 10.3% 높아짐을 확인하였다.

요약
Abstract
1. 서론
2. 관련연구
2.1 데이터 중복 제거(De-duplication)
2.2 쿠쿠 해싱 필터 (Cuckoo Hashing Filter)
3. 제안 모델
3.1 시스템 아키텍처
3.2 중복 데이터 배제 프로세서
3.3 클러스터링 및 중복 제거 기법
4. 실험 및 평가
4.1 실험 환경
4.2 결과 및 분석
5. 결론
REFERENCES

키워드

분산중복제거 빅 데이터 쿠쿠 해시 다중계층 쿠쿠 필터 소프트웨어 스토리지 Distributed Deduplication Big Data Cuckoo Hash Multilayer Cuckoo Filter Software Storage

저자

김영아 [ Yeong-A Kim | 엔코아 데이터 HRD 본부 연구원 ]
김계희 [ Gea-Hee Kim | 경남과학기술대학교 컴퓨터공학과 강사 ]
김현주 [ Hyun-Ju Kim | 경남과학기술대학교 컴퓨터공학과 교수 ]
김창근 [ Chang-Geun Kim | 경남과학기술대학교 컴퓨터공학과 교수 ] Corresponding author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

중소기업융합학회 [Convergence Society for SMB]
설립연도
2011
분야
공학>공학일반
소개
본 회는 정보기술을 다양한 산업 분야에 융합하는 정책 및 관련 기술들을 개발하고 보급함으로써 중소기업 발전은 물론 이를 통한 국가발전과 국제협력 증진에 기여하고자 한다.

간행물

간행물명

융합정보논문지(구 중소기업융합학회논문지) [Journal of Convergence for Information Technology]
간기
월간
pISSN
2586-1816
eISSN
2586-4440
수록기간
2011~2022
십진분류
KDC 004 DDC 004

이 권호 내 다른 논문 / 융합정보논문지(구 중소기업융합학회논문지) 제10권 제10호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

쿠쿠 필터 유사도를 적용한 다중 필터 분산 중복 제거 시스템 설계 및 구현
Design and Implementation of Multiple Filter Distributed Deduplication System Applying Cuckoo Filter Similarity

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 융합정보논문지(구 중소기업융합학회논문지) 제10권 제10호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

쿠쿠 필터 유사도를 적용한 다중 필터 분산 중복 제거 시스템 설계 및 구현 Design and Implementation of Multiple Filter Distributed Deduplication System Applying Cuckoo Filter Similarity

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 융합정보논문지(구 중소기업융합학회논문지) 제10권 제10호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

쿠쿠 필터 유사도를 적용한 다중 필터 분산 중복 제거 시스템 설계 및 구현
Design and Implementation of Multiple Filter Distributed Deduplication System Applying Cuckoo Filter Similarity