차세대 네트워크에서는 제한된 자원을 가진 수많은 장치가 실시간 응용 서비스를 위해 지연에 민감 하고 복잡한 작업을 수행해야 함에 따라 작업 오프로딩과 자원 할당이 점차 중요해지고 있다. 이는 복 잡한 결정 문제로 사전 지식 없이 최적 결정을 선택할 수 있는 강화 학습을 통해 해결할 수 있다. 본 연구는 이를 위한 연합 심층 강화 학습의 연구 동향을 정리하고, 자원 제약과 학습 구조를 중심으로 분석한 후 향후 연구 방향을 제시하고자 한다.
목차
요약 1. 서론 2. 관련 연구 환경 2.1. 지상 네트워크 2.2. 공중 네트워크 2.3. 우주 네트워크 3. 자원 제약 조건 4. 학습 구조 설계 5. 결론 Acknowledgement 참고문헌