상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
153039.jpg
KCI등재 학술저널

한국프로야구에서 데이터마이닝을 이용한 팀대 팀 승패모형

Win-Lose Models When Two Teams Meet Using Data Mining in the Korean Pro-Baseball

  • 51

본 연구에서는 한국프로야구 경기에서 팀대 팀의 승패에 기여하는 변수와 그 영향을 알아보기 위해 2000년부터 2006년까지 있었던 3,567 게임에 대하여 로지스틱 회귀모형, 의사결정나무모형, 신경망모형을 활용한 통계적 승패모형을 제시하였다. 사용된 변수들은 경기 직전까지의 득점, 실점, 이전승률, 상대팀에 대한 득점, 실점, 누적득점 및 누적실점 등 28개의 독립변수이다. 그 결과 제안된 모형들은 상대팀에 대한 이전승률, 팀의 득점 등이 중요한 비중을 차지하였고, 1점 차이 경기인 경우에는 홈팀 여부도 중요한 요인으로 작용하였다. 또한 세 가지 모형의 효율성은 비슷하게 나타났으나 로지스틱 회귀모형과 신경망모형이 다소 의사결정나무모형보다 분류정확율이 높았다.

The primary purpose of this study is to identify the factors that affect the likelihood of a team winning a game in Korean Pro-Baseball by estimating three supervised learnings. Using data from the 3,567 baseball games that were played in the Korean Pro-Baseball from the 2000 to 2006 seasons, models that measure the likelihood of a team winning a game are estimated. For statistical analysis, logistic regression model, neural network model and decision tree model were conducted and the results were compared and presented. As a result, the neural network model and logistic regression model are more efficient than decision tree model under existing conditions.

Ⅰ. 서론

Ⅱ. 연구방법

Ⅲ. 데이터 분석

Ⅳ. 결론

참고문헌

로딩중