상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
사회융합연구 제6권 제3호.jpg
KCI등재 학술저널

벌점화 회귀분석을 이용한 English Premier League의 승점 예측모형 개발 및 경기력 요인 탐색

Development of Score Prediction Model and Exploration of Athletic Performance Factors for English Premier League Using Penalized Regression Analysis

4차 산업혁명과 함께 ICT의 발전에 힘입어 축구 관련 산업과 연구도 비약적인 발전을 하고 있다. 이에 각 국가에서는 프로리그를 운영하고 있으며, 각 팀은 승리하기 위하여 다양한 노력을 하고 있다. 그 목적으로 경기 결과에 유의하게 영향을 미치는 경기력 요인이 무엇인지를 찾는 연구 등이 수행되고 있다. 이 과정에서 최소제곱 추정에 기반한 선형회귀분석이 자주 사용되고 있는데, 이 방법은 여러 문제점을 갖고 있다. 그래서 대안으로 최근 들어 벌점화 잔차제곱합을 최소로 하는 벌점화 회귀분석이 그 대안으로 개발되어 오고 있다. 그런데 벌점화 회귀분석을 축구의 승점예측에 활용한 연구는 거의 없는 실정이다. 이에 본 연구에서는 벌점화 회귀분석의 활성화를 위하여 이론적인 내용을 소개하고 나아가 2020~2021 EPL 데이터로 실증 분석함으로써 활용 예를 제시하였고, 실증분석한 결과 LASSO 모형과 신축망 모형이 RMSE 관점에서 더욱 적절한 통계적 예측모형인 것으로 나타났다. 그리고 분석에 사용된 19개 변수 중 tackles, clean sheets, save 등의 수비적인 요인들이 승점에 매우 중요한 경기력 요인으로 분석되었다. 본 연구의 결과를 토대로 향후 보다 심층적인 연구를 위하여, EPL 홈페이지에 선수들의 총 이동 거리, 스프린트 횟수, 순간 속도, 공격수와 수비수 간의 거리 등 활동 형태의 데이터를 주기를 희망해 본다.

Advancements in Information Communication Technology during the Fourth Industrial Revolution have led to rapid progress in soccer-related industries and research. Various countries have professional soccer leagues devoted to securing victory. These activities include studies that identify the performance factors that significantly influence the outcome of matches. Researchers often use linear regression analysis based on least-squares estimation for this process, but this method has several issues. As an alternative to this, penalized regression analysis that minimizes the penalty-pointed residual sum of squares has been developed as an alternative. However, there are few studies using the penalty point regression analysis to predict points in soccer. Therefore, in this study, theoretical contents were introduced to activate the penalty point regression analysis, and further examples of application were presented by empirically analyzing 2020-2021 EPL(EPL: The Football Association Premier League Limited) data. It was found to be a statistical predictive model. According to the results, the LASSO model and elastic net models were more suitable statistical prediction models from the perspective of the root mean square error (RMSE). Additionally, among the 19 variables used in the analysis, defensive factors such as tackles, clean sheets, and saves were identified as critical performance factors that impacted the score. Based on the results of this study, in order to enable more in-depth research in the future, the researchers hope that the EPL website will provide activity data, such as the total distance traveled, number of sprints, instantaneous speed, and distance between attackers and defenders.

1. 서론

2. 벌점화 회귀분석에 대한 고찰

3. 자료 수집 및 연구 방법

4. 결과

5. 논의

6. 결론

로딩중