상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
커버이미지 없음
KCI등재 학술저널

다중회귀분석을 이용한 메이저리그 승률의 모형구축과 예측

Model Construction and Prediction of Major League Baseball WPCT Using Multiple Regression Analysis

DOI : 10.37727/jkdas.2017.19.4.2071
  • 281

본 연구에서는 미국 메이저리그 야구 경기에서 다중회귀분석을 이용하여 승률을 추정하는 통계 모형을 제시하고, 이를 바탕으로 2015년의 결과를 예측하고자 하였다. 이를 위하여 메이저리그 2009년부터 2013년까지 팀당 162경기의 경기 결과를 대상으로 타자 지표 27개, 투수 지표 37개, 수비 지표 15개 등을 선정하여 승률을 반응변수로, 나머지 78개의 변수들을 설명변수로 하여 분석하였다. 산점도를 통하여 35개의 변수를 선정한 후 stepwise 방식을 사용하여 최종적으로 6개의 변수를 선정하였다. 그 결과 득점, 실점, 세이브, 완봉경기, 삼진, 홈런의 변수가 승률에 영향을 미친 것으로 나타났다. 이 모형을 2015년 승률에 적용한 결과 각 리그의 순위는 정확하게 일치하였고, 승률은 1, 2위 예측은 실제 값과 3% 이내로 일치하였으며, 나머지 순위의 승률도 대부분 일치하는 것으로 나타났다. 승률을 높이기 위해서 투수 부문에서는 확실한 선발 투수와 경기를 마무리할 수 있는 전문 투수가 필요하고, 가장 쉽게 점수를 얻을 수 있는 방법인 홈런을 칠 수 있는 클러치 타자가 필요하며, 삼진을 당하지 않을수록 승률이 좋은 것을 알 수 있다.

In this study, we propose a statistical model that estimates the WPCT of a major league baseball game in the US using multiple regression analysis. To accomplish this, the results of 162 matches per team from 2009 to 2013 were selected, and 27 hitting ratios, 37 pitching ratios, and 15 fielding ratios were selected, respectively. After selecting 35 variables through scatter plot, six variables were finally selected using stepwise method. As a result, the variables of score, run, save, shut-out, strikeouts, and home-run affected the WPCT, and the result of applying this model to the 2015 WPCT was exactly the rank of each league. It is within 3% of the actual value, and the WPCT of the remaining ranks are almost the same. In order to increase the WPCT, the pitcher needs a reliable starting pitcher and professional pitcher to finish the game, and the batter needs a clutch hit to hit the home-run, the easiest way to score points. Finally, the number of strikeouts should be reduced.

1. 서론

2. 연구방법

3. 연구결과

4. 결론

로딩중