This paper describes a methodology for autonomous flying drones to learn optimal paths between multiple destinations. Specifically, we define this problem as a Traveling Salesman Problem (TSP) and utilize reinforcement learning techniques to enable the drone to find optimal paths within a virtual environment. This methodology focuses on the virtual drone interacting in real-time within the virtual environment and effectively employing reinforcement learning algorithms to minimize path length. Experimental results demonstrate that our proposed method successfully generates more efficient routes compared to existing greedy algorithms, showcasing the potential value of applying reinforcement learning to autonomous drone path planning in virtual environments.
한국어
본 논문은 자율 비행 드론이 여러 목적지 간 최적 경로를 학습하는 문제에 대한 방법론을 기술한다. 특히, 우리는 이 문제를 여행자 외판원 문제(TSP)로 정의하고, 강화 학습 기술을 활용하여 가상 환경에서 드론이 최적의 경로를 찾도록 한다. 이 방법론은 가상드론이 가상환경에서 실시간으로 상호 작용하며, 경로를 최소화하기 위해 강화학습 알고리즘을 효과적으로 활용하는 것에 중점을 둔다. 실험결과는 우리의 제안된 방법이 기존의 탐욕적 알고리즘에 비해 효율적인 경로를 생성하는 데 성공하였음을 보여주며, 가상 환경에서 자율 비행 드론의 경로 계획에 강화학습을 적용하는 잠재적인 가치를 보여준다.
목차
요약 Abstract 1. 서론 2. 선행연구 3. 사례 연구와 적용 4. 연구결과 5. 결론 감사의 글 REFERENCES