다중 AGV 시스템에서 PPO 기반 협력 강화학습을 통한 충돌 및 교착 회피 경로계획 설계
Experimental Design of Semantic-based Multi- Agent Reinforcement Learning for Deadlock Prevention in Multi-AGV Systems
다수의 자동 운반 차량(AGV)을 운용하는 시스템에서는 AGV 간의 충돌, 교착 상태 발생, 그리 고 비효율적인 대기 시간 증가로 인해 전체 시스템의 효율성이 저하되는 문제가 빈번하게 발생한 다. 본 논문은 이러한 문제를 해결하기 위해, 연속적인 공간으로 모델링된 공장 환경에서 100대의 AGV가 상호 협력을 통해 최적의 경로를 계획하도록 하는 PPO(Proximal Policy Optimization) 기 반 분산 강화학습 모델의 실험 설계를 제안한다. 제안하는 설계는 시뮬레이션 환경 구성, 개별 AGV 에이전트 모델링, 보상 함수 체계, 그리고 학습 구조를 체계적으로 정의함으로써, AGV 간의 충돌을 회피하고 교착 상태를 방지하며 이동 경로상의 비효율을 최소화하는 것을 목표로 한다. 이 설계를 통해 대규모 다중 AGV 시스템의 운영 안전성과 효율성을 향상시킬 수 있을 것으로 기대한다.
목차
요약 1. 서론 2. 관련연구 3. 실험방법 3.1. 환경 설계 3.2. AGV 에이전트 설계 3.3. 보상 함수 설계 3.4. 학습 구조 및 알고리즘 4. 결론 Acknowledgement 참고문헌