Earticle

현재 위치 Home

MR-IoT Session

Edge TPU 에서의 실시간 DNN 작업을 위한 SRAM 할당 및 모델 분할 기법
SRAM Allocation and Model Partitioning for Real-time DNN Tasks on Edge TPU

첫 페이지 보기
  • 발행기관
    한국차세대컴퓨팅학회 바로가기
  • 간행물
    한국차세대컴퓨팅학회 학술대회 바로가기
  • 통권
    2023 한국차세대컴퓨팅학회 춘계학술대회 (2023.06)바로가기
  • 페이지
    pp.320-322
  • 저자
    한창헌, 오상은
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A433576

원문정보

초록

한국어
딥러닝 가속기는 저전력 고효율의 특징을 가지며, 임베디드 시스템에서 직접 DNN 작업을 수행할 수 있어 높은 반응성을 얻을 수 있다. 본 논문에서는 실시간성을 보장하기 위한 Edge TPU에서의 우리의 프레임워크를 제안한다. 이를 위해 Edge TPU 내부적으로 실시간성을 방해하는 문제를 발견하였으며, SRAM 할당 및 모델 분할을 지원하는 프레임워크를 소개한다. 최적의 SRAM 할당 및 모델 분할 개수를 찾기 위해 혼합 정수 계획법 기반의 알고리즘을 고안하였고, 이를 우리의 프레임워크에 적용하여 Edge TPU에서의 실시간성을 극대화할 수 있었다.

목차

요약
1. 서론
2. SRAM 할당 및 모델 분할 프레임워크
3. 결론 및 향후 연구
Acknowledgement
참고문헌

키워드

Real-Time Systems Real-Time DNN Google Edge TPU Memory Allocation

저자

  • 한창헌 [ AI 융합네트워크학과 아주대학교 ]
  • 오상은 [ AI 융합네트워크학과 아주대학교 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • 설립연도
    2005
  • 분야
    공학>컴퓨터학
  • 소개
    본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

  • 간행물명
    한국차세대컴퓨팅학회 학술대회
  • 간기
    반년간
  • 수록기간
    2021~2025
  • 십진분류
    KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 학술대회 2023 한국차세대컴퓨팅학회 춘계학술대회

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장