매치 3 게임 플레이를 위한 PPO 알고리즘을 이용한 강화학습 에이전트의 설계 및 구현

박대근; 이완복

216.73.217.141

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

매치 3 게임 플레이를 위한 PPO 알고리즘을 이용한 강화학습 에이전트의 설계 및 구현
Design and Implementation of Reinforcement Learning Agent Using PPO Algorithim for Match 3 Gameplay

발행기관

중소기업융합학회 바로가기
간행물

융합정보논문지(구 중소기업융합학회논문지) KCI 등재 바로가기
통권

제11권 제3호 (2021.03)바로가기
페이지

pp.1-6
저자

박대근, 이완복
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A391719

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어: Most　of the match-3 puzzle games supports automatic play using the MCTS algorithm. However, implementing reinforcement learning agents is not an easy job because it requires both the　knowledge of machine learning and the way of complex interactions within the development environment.　This study proposes a method in which we can easily design reinforcement learning agents and implement game play agents by applying PPO(Proximal Policy Optimization) algorithms. And we could identify the performance was increased about 44% than the conventional method. The tools we used are the Unity 3D game engine and Unity ML SDK.　The experimental result shows that agents became to learn game rules and make better strategic decisions as experiments go on. On average, the puzzle gameplay agents implemented in this study played puzzle games better than normal people.　It is expected that the designed agent could be used to speed up the game level design process.

한국어: 매치 3 퍼즐 게임들은 주로 MCTS(Monte Carlo Tree Search) 알고리즘을 사용하여 자동 플레이를 구현 하였지만 MCTS의 느린 탐색 속도로 인해 MCTS와 DNN(Deep Neural Network)을 함께 적용하거나 강화학습 으로 인공지능을 구현하는 것이 일반적인 경향이다.　본 연구에서는 매치 3 게임 개발에 주로 사용되는 유니티3D 엔진과 유니티 개발사에서 제공해주는 머신러닝 SDK를 이용하여 PPO(Proximal Policy Optimization) 알고리 즘을 적용한 강화학습 에이전트를 설계 및 구현하여, 그 성능을 확인해본 결과, 44% 정도 성능이 향상되었음을 확인하였다. 실험 결과 에이전트가 게임 규칙을 배우고 실험이 진행됨에 따라 더 나은 전략적 결정을 도출 해 낼 수 있는 것을 확인할 수 있었으며 보통 사람들보다 퍼즐 게임을 더 잘 수행하는 결과를 확인하였다. 본 연구에서 설계 및 구현한 에이전트가 일반 사람들보다 더 잘 플레이하는 만큼, 기계와 인간 플레이 수준 사이의 간극을 조절 하여 게임의 레벨 디지인에 적용된다면 향후 빠른 스테이지 개발에 도움이 될 것으로 기대된다.

요약
Abstract
1. 서론
2. 배경　연구
2.1 몬테카를로 트리 탐색
2.2 강화학습（Reinforcement Learning）
3. 설계　및　구현
3.1 Match 3 Game 구현
3.2 ML 에이전트 구성
4. 실험 및 결과
4.1 학습　환경
4.2 비교　데이터　설정
4.3 결과　분석
5. 결론
REFERENCES

키워드

게임 인공지능 자동 플레이 강화학습 매치 ３ 퍼즐 유니티 ML Game AI Auto Play Reinforcement Learning Match 3 Puzzle Unity ML

저자

박대근 [ Dae-Geun Park | 공주대학교 게임디자인학과 석사과정 ]
이완복 [ Wan-Bok Lee | 공주대학교 게임디자인학과 교수 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

중소기업융합학회 [Convergence Society for SMB]
설립연도
2011
분야
공학>공학일반
소개
본 회는 정보기술을 다양한 산업 분야에 융합하는 정책 및 관련 기술들을 개발하고 보급함으로써 중소기업 발전은 물론 이를 통한 국가발전과 국제협력 증진에 기여하고자 한다.

간행물

간행물명

융합정보논문지(구 중소기업융합학회논문지) [Journal of Convergence for Information Technology]
간기
월간
pISSN
2586-1816
eISSN
2586-4440
수록기간
2011~2022
십진분류
KDC 004 DDC 004

이 권호 내 다른 논문 / 융합정보논문지(구 중소기업융합학회논문지) 제11권 제3호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

매치 3 게임 플레이를 위한 PPO 알고리즘을 이용한 강화학습 에이전트의 설계 및 구현
Design and Implementation of Reinforcement Learning Agent Using PPO Algorithim for Match 3 Gameplay

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 융합정보논문지(구 중소기업융합학회논문지) 제11권 제3호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

매치 3 게임 플레이를 위한 PPO 알고리즘을 이용한 강화학습 에이전트의 설계 및 구현 Design and Implementation of Reinforcement Learning Agent Using PPO Algorithim for Match 3 Gameplay

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 융합정보논문지(구 중소기업융합학회논문지) 제11권 제3호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

매치 3 게임 플레이를 위한 PPO 알고리즘을 이용한 강화학습 에이전트의 설계 및 구현
Design and Implementation of Reinforcement Learning Agent Using PPO Algorithim for Match 3 Gameplay