Earticle

현재 위치 Home

머신러닝을 활용한 빅데이터 분석을 통해 KBO 타자의 OPS 예측
Predicting the OPS of KBO Batters through Big Data Analysis Using Machine Learning

첫 페이지 보기
  • 발행기관
    국제차세대융합기술학회 바로가기
  • 간행물
    차세대융합기술학회논문지 KCI 등재 바로가기
  • 통권
    제6권 1호 (2022.01)바로가기
  • 페이지
    pp.12-18
  • 저자
    한정섭, 정다현, 김성준
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A407201

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
Recently, research on artificial intelligence has been actively conducted in various industries such as sports, and Big Data analysis technologies in the sports field are rapidly developing. In particular, baseball is difficult to predict next year's game results because certain players' performance fluctuates significantly every year. The purpose of this study is to propose a model that predicts the OPS(On-base Plus Sluging) of batters by applying machine learning algorithms based on the data of batters generated in the KBO(Korea Baseball Organization) regular season. OPS is an index that measures accuracy and slugging power based on batter's on-base percentage and slugging percentage. A total of six variables were extracted, including slugging percentage, on-base percentage, batting average, home run, RBI, and scoring variables, through correlation analysis of variables affecting batters' OPS in the 1982-2020 KBO regular season. The XGBoost(eXtreme Gradient Boosting) prediction technique used in this study showed the best OPS prediction performance through a model that predicts OPS of others through machine learning.
한국어
최근, 인공지능 관련 연구가 스포츠와 같은 다양한 산업에서 활발하게 진행되고 있으며, 스포츠 분야의 빅 데이터 분석 기술을 빠르게 발전하고 있다. 특히 야구는 매년 특정 선수의 성적이 크게 요동치기 때문에 내년 경기 결과를 예측하기 어렵다. 이번 연구는 KBO(Korea Baseball Organization) 정규시즌에서 생성된 타자의 데이터를 바탕으로 머신러닝 알고리즘을 적용해 타자의 OPS(On-base Plus Slugging)를 예측하는 모델을 제안하기 위한 것 이다. OPS는 타자의 출루율과 장타율을 바탕으로 정확도와 장타력을 측정하는 지수다. 1982~2020년 KBO 정규시 즌 타자의 데이터를 바탕으로 타자의 OPS에 영향을 미치는 변수의 상관 분석을 통해 장타율, 출루율, 타율, 홈런, 타점, 득점 변수 등 총 6개의 변수를 추출하였다. 이번 연구에서 사용된 XGBoost(Extreme Gradient Boosting) 예 측기법은 머신러닝을 통해 타자의 OPS를 예측하는 모델을 통해 최고의 OPS 예측 성능을 보여주었다.

목차

요약
Abstract
Ⅰ. 서론
1.1 연구의 배경 및 목적
1.2 연구 범위 및 방법
Ⅱ. 선행 연구 고찰
Ⅲ. 머신러닝 방법론
3.1 XGBoost
3.2 LightGBM
3.3 RandomForest
3.4 Support Vector Regression
3.5 Linear Regression
3.6 Ridge
3.7 Lasso
Ⅳ. 머신러닝을 이용한 OPS 예측모델 개발
4.1 데이터 및 변수
4.2 데이터 전처리
4.3 평가모델 성능
Ⅴ. 결론
REFERENCES

키워드

머신러닝 파이썬 XGBoost KBO OPS Machine learning Python XGBoost KBO OPS

저자

  • 한정섭 [ Jeong-Seop Han | 남서울대학교 빅데이터콘텐츠융합학과 학생 ]
  • 정다현 [ Da-Hyun Jung | 서강대학교 정보통신대학원 학생 ]
  • 김성준 [ Sung-Jun Kim | 남서울대학교 빅데이터콘텐츠융합학과 교수 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    국제차세대융합기술학회 [International Next-generation Convergence technology Association]
  • 설립연도
    2017
  • 분야
    복합학>기술정책
  • 소개
    Ever since next generation convergence technology became one of the most important industries in the nation, computing professionals have encountered a growing number of challenges. Along with scholars and colleagues in related fields, they have gathered in avariety of forums and meetings over the last few decades to share their knowledge, experiences and the outcome of their research. These exchanges have led to the founding of the International Next-generation Convergence technology (INCA) on December 1, 2015. INCA was registered as an incorporated association under the Ministry of Information and Communications. The main purpose of the organization is to improve our society by achieving the highest capability possible in next generation convergence technology.

간행물

  • 간행물명
    차세대융합기술학회논문지 [The Journal of Next-generation Convergence Technology Association]
  • 간기
    월간
  • pISSN
    2508-8270
  • 수록기간
    2017~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 506 DDC 606

이 권호 내 다른 논문 / 차세대융합기술학회논문지 제6권 1호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장