Earticle

현재 위치 Home

한국 프로야구에서 등급별 선수 구성 정보를 활용한 기계학습 회귀 모델의 팀 득점 예측력 개선
Improving prediction ability of Team Runs for machine learning regression model with player composition information by grade in KBO(Korea Baseball Organization)

첫 페이지 보기
  • 발행기관
    한국차세대컴퓨팅학회 바로가기
  • 간행물
    한국차세대컴퓨팅학회 논문지 KCI 등재 바로가기
  • 통권
    Vol.19 No.4 (2023.08)바로가기
  • 페이지
    pp.7-19
  • 저자
    신동윤, 김진호
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A434880

원문정보

초록

영어
Baseball is a sport in which a runner can get “Runs” only when there is a batter who raises an RBI. And since each batter receives equal opportunities to bat, it is impossible to funnel more offensive opportunities into a standout player. Therefore, player composition is particularly important. In this study, we checked whether the batter composition information could be usefully used to predict team runs more accurately. Players were given a grade for each evaluation index based on individual evaluation indicators. Such as batting average(AVG), on-base percentage(OBP), slugging percentage(SLG), OPS(On-Base Plus Slugging), wOBA(weighted On Base Average), wRC+(Weighted Runs Created), and the player distribution information for each grade was used to predict team runs. As a result of the experiment, it was confirmed that the team runs were predicted more accurately if we used the player distribution information by grade with team's batting statistics than used only team's batting statistics. The method proposed in this study considers the number of players in each grade to predict the team's scoring ability. So it is useful not only in improving prediction accuracy but also in predicting the level of the team's scoring ability hierarchically among teams with similar statistic values.
한국어
야구는 “타점”을 해주는 타자가 있어야 주자가 “득점”을 할 수 있고, 타순별로 균등하게 공격 기회를 부여받는다는 특 징이 있다. 이러한 특징은 공격이 우수한 선수에게 공격 기회를 집중시킬 수 없다는 것을 의미하는데, 그렇기 때문 에 선수 구성이 특히 중요한 종목이다. 본 연구에서는 이 선수 구성 정보가 팀 득점 예측력을 높이는 데에 유용하게 사용될 수 있는지를 확인해 보았다. 타율(AVG), 출루율(OBP), 장타율(SLG), OPS(On-Base Plus Slugging), wOBA(Weighted On Base Average), wRC+(Weighted Runs Created) 등의 개인별 평가지표를 기준으로 선수들에게 각각의 평가지표별 등급을 부여하고, 이 등급별 선수 분포 정보를 팀 득점 예측에 사용하였다. 실험 결 과, 등급별 선수 분포 정보를 팀 공격력 통계와 함께 사용하여 팀 득점을 예측하면, 팀 통계만을 사용하여 예측하는 것보다 더 정확하게 팀 득점을 예측하였다. 본 연구에서 제안하는 방법은, 각 통계 항목별로 어떤 등급의 선수들이 몇 명씩 있는지 까지를 고려하여 팀 득점을 예측하는 방법이므로, 예측력을 높여줄 뿐만 아니라, 팀 통계가 비슷한 팀들 사이에서 팀 득점에 대한 우열을 예측하고자 할 때 유용하게 사용할 수 있다.

목차

요약
Abstract
1. 서론
2. 관련 연구
2.1 타자 평가지표에 관련된 연구
2.2 팀 득점에 관련된 연구
2.3 기계학습을 야구 데이터에 적용한 연구
3. 기계학습 모델을 활용한 팀 득점 예측방법 제안
3.1 평가지표의 등급 분류 방법
3.2 평가지표 종류 및 회귀 변수 설정
3.3 모델 구축 절차
3.4 팀 득점 예측 제안 모델
4. 실험 및 평가
4.1. 팀 득점 예측 실험 결과
4.2. 공격력이 비슷한 팀들 사이에서의 우위 예측
5. 결론 및 향후 연구
Acknowledgement
참고문헌

키워드

야구 득점 인공지능 기계학습 회귀 Baseball Runs Artificial Intelligence Machine Learning Regression

저자

  • 신동윤 [ Dong Yun Shin | 주식회사 클로잇 DevOps그룹 ]
  • 김진호 [ Jinho Kim | 강원대학교 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • 설립연도
    2005
  • 분야
    공학>컴퓨터학
  • 소개
    본 학회는 차세대 PC 및 그 관련분야의 학술활동을 통하여 차세대 PC의 학문 및 기술발전을 도모하고 산업발전 및 국제협력 증진을 목적으로 한다.

간행물

  • 간행물명
    한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]
  • 간기
    격월간
  • pISSN
    1975-681X
  • 수록기간
    2005~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 566 DDC 004

이 권호 내 다른 논문 / 한국차세대컴퓨팅학회 논문지 Vol.19 No.4

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장