Earticle

다운로드

Edge AI 의 추론 과정을 위한 계층적 작업 분할 배치 기법
Hierarchical Job Placement Method for Inference Process of Edge AI

  • 간행물
    한국차세대컴퓨팅학회 학술대회 바로가기
  • 권호(발행년)
    2021 한국차세대컴퓨팅학회 춘계학술대회 (2021.05) 바로가기
  • 페이지
    pp.26-29
  • 저자
    이승준, 여상호, 오상윤
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A409319

원문정보

초록

한국어
머신러닝 모델을 엣지 디바이스에 안정적으로 배포하기 위해서 기존 클라우드 기반의 머신 러닝 모델 배포는 높은 지연 시간으로 인해 머신 러닝 서비스의 질을 떨어트리는 문제를 야기한다. 또한, 추론을 위한 입력 데이터의 전송 과정은 개인 정보의 유출을 야기한다. 이러한 문제를 해결하기 위해서 개인 정보 유출 및 통신 부하 문제를 해결할 수 있는 엣지 서버 및 엣지 디바이스를 활용한 추론 과정의 정의가 요구된다. 본 연구팀은 효과적인 추론 과정의 정의를 위해 기존 분산 딥러닝의 모델 및 데이터 병렬화 파이프라인 기법에 기반하는 단일 추론 모델에 대한 엣지 서버-디바이스 간 모델 분할 기법 및 엣지에서 요청되는 독립된 다중 작업들에 대한 효과적인 스케쥴링 기법을 제안한다.

목차

Abstract
1. 서론
2. 배경
2.1 Edge AI
2.2 분산딥러닝 파이프라인 기술
3. 효율적인 Edge AI를 위한 엣지 디바이스 및 엣지 서버 간의 효과적인 추론작업 배치 기법
3.1 모델 병렬화 파이프라인 기법 기반의 엣지 서버-디바이스 간 모델 배치 기법
3.2 효과적인 엣지 자원활용을 위한 추론 작업의 중첩
4. 결론 및 향후 계획
Acknowledgement
References

저자

  • 이승준 [ 인공지능학과 아주대학교 수원, 대한민국 ]
  • 여상호 [ 인공지능학과 아주대학교 수원, 대한민국 ]
  • 오상윤 [ 소프트웨어학과 아주대학교 수원, 대한민국 ]

참고문헌

자료제공 : 네이버학술정보

    간행물 정보

    • 간행물
      한국차세대컴퓨팅학회 학술대회
    • 간기
      반년간
    • 수록기간
      2021~2025
    • 십진분류
      KDC 566 DDC 004