고병렬 데이터 스트림을 위한 분산 메시지 큐 시스템의 확장성 분석

백승연; 이우경; 최원석; 이하얀; 신승민; 이은지

216.73.216.207

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

인터넷

고병렬 데이터 스트림을 위한 분산 메시지 큐 시스템의 확장성 분석
Scalability Analysis of Distributed Messaging Queuing Systems for Highly Parallel Data Streams

발행기관

국제인공지능학회(구 한국인터넷방송통신학회) 바로가기
간행물

한국인터넷방송통신학회 논문지 KCI 등재 바로가기
통권

제24권 제6호 (2024.12)바로가기
페이지

pp.15-20
저자

백승연, 이우경, 최원석, 이하얀, 신승민, 이은지
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A462069

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

원문정보

초록

영어: The growth of big data services has expanded execution structures where multiple processes share large data volumes. Distributed message queue systems like Apache Kafka, which enable asynchronous data sharing, are essential here. Apache Kafka allows incoming messages for a single topic to be distributed and stored across multiple partitions. A partition represents an abstraction for an independent data flow, and ideally, as the number of partitions increases, the message queue’s throughput should scale linearly. In this paper, we examine through various experiments whether Kafka’s current scalability approach, which relies on partitions, is effective. Experimental results reveal that while increasing partitions improves throughput, it fails to achieve linear scaling even when sufficient resources are available. This limitation appears to stem from an inability to fully maintain independence in the implementation of partitions, which are intended to represent independent data streams. Building on these findings, we aim to analyze in detail the factors that hinder high-parallelism data stream support via partitions and propose methods to address these issues.

한국어: 최근 빅데이터 기반 서비스의 증가는 다수의 프로세스가 고용량의 데이터를 송수신하면서 협력하는 실행 구조의 확산을 가져왔다. 프로세스 간 데이터를 비동기적으로 송수신하도록 도와주는 분산 메시지 큐 시스템은 상기 실행 환경 에서 중요한 역할을 수행한다. 양 프로세스 간 동기적 데이터 송수신은 동기화 과정에서 상당한 비효율성을 지니기 때문 에 데이터를 생산/소비하는 프로세스와 별개로 데이터를 풀링(Pooling)해주고, 상시로 데이터를 소비할수 있도록 해주 기 때문에 데이터 공유가 용이해 지기 때문이다. 대표적인 분산 메시지 큐 시스템인 Apache Kafka는 단일 토픽 (Topic)에 대해 유입되는 메시지를 다수의 파티션으로 분산하여 저장할 수 있도록 한다. 파티션은 데이터를 저장하는 독립적인 플로우(Flow)에 대한 추상화 이상적으로는 그 수가 증가하면 메시지 큐의 처리량도 선형적으로 증가해야 한다. 본 논문에서는 파티션에 의존하는 현재의 Kafka 확장성(Scalability) 보장 방식이 실효성을 지니는지 다양한 실험을 통 해 관찰한다. 실험 결과 파티션의 증가가 처리량을 개선시키는 데에 효과는 있으나 자원이 충분함에도 불구하고 선형적 인 증가는 이끌어내지 못하는 것을 관찰하였다. 이것은 파티션이라는 독립적인 데이터 스트림을 나타내는 추상적 개념을 구현할 때 그 독립성을 충분히 확보하지 못하는 것으로 판단된다. 향후 본 논문에서 분석한 실험 결과를 바탕으로 파티 션을 통한 고병렬성 데이터 스트림 지원을 방해하는 요소를 구체적으로 분석하고 이를 개선하는 방안을 제안하고자 한다.

키워드

Cloud Computing Data Streaming Distributed Message Queuing Data Systems

저자

백승연 [ Seungyeon Baek | 준회원, 숭실대학교 AI융합학부 ]
이우경 [ Wookyung Lee | 준회원, 숭실대학교 AI융합학부 ]
최원석 [ Wonseok Choi | 준회원, 숭실대학교 AI융합학부 ]
이하얀 [ Hayan Lee | 준회원, 숭실대학교 AI융합학부 ]
신승민 [ Seungmin Shin | 준회원, 숭실대학교 AI융합학부 ]
이은지 [ Eunji Lee | 정회원, 숭실대학교 AI융합학부 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

국제인공지능학회(구 한국인터넷방송통신학회) [The International Association for Artificial Intelligence]
설립연도
2000
분야
공학>전자/정보통신공학
소개
인터넷방송, 인터넷 TV , 방송 통신 네트워크 및 관련 분야에 대한 국내는 물론 국제적인 학술, 기술의 진흥발전에 공헌하고 지식 정보화 사회에 기여하고자 한다.

간행물

간행물명

한국인터넷방송통신학회 논문지 [The Journal of the Institute of Internet, Broadcasting and Communication]
간기
격월간
pISSN
2289-0238
eISSN
2289-0246
수록기간
2001~2025
십진분류
KDC 326 DDC 380

이 권호 내 다른 논문 / 한국인터넷방송통신학회 논문지 제24권 제6호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

고병렬 데이터 스트림을 위한 분산 메시지 큐 시스템의 확장성 분석
Scalability Analysis of Distributed Messaging Queuing Systems for Highly Parallel Data Streams

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국인터넷방송통신학회 논문지 제24권 제6호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

고병렬 데이터 스트림을 위한 분산 메시지 큐 시스템의 확장성 분석 Scalability Analysis of Distributed Messaging Queuing Systems for Highly Parallel Data Streams

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국인터넷방송통신학회 논문지 제24권 제6호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

고병렬 데이터 스트림을 위한 분산 메시지 큐 시스템의 확장성 분석
Scalability Analysis of Distributed Messaging Queuing Systems for Highly Parallel Data Streams