상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
학술저널

머신러닝 기법을 활용한 중학생의 영어과목 학업성취 예측 및 주요 요인 탐색

Predicting Middle School Students' English Academic Achievement and Exploring Key Factors Using Machine Learning Techniques

  • 75
학습자 25-7.PNG

목적 본 연구에서는 다양한 머신러닝 기법들로 중학생의 영어교과 학업성취를 예측하고, 주요 예측요인들을 상대적 중요도를 탐색하여 학년별로 비교·분석하였다. 방법 이를 위하여 최근접이웃기법(KNN), 의사결정나무(C5.0), 랜덤포레스트(RF), 서포트벡터머신(SVM), 신경망(NNET) 등의 머신러닝 기법을 활용하여, 학년별로 기법별 예측력을 비교 및 분석하고, 주요한 예측요인들을 파악하고자 하였다. 학업성취를 학년별로 비교하기 위하여 영어과목 수직척도점수를 활용하였고, 학업성취를 예측하기 위한 요인은 개인수준, 가정수준, 그리고 학교수준으로 나누어 살펴보았다. 이를 위하여 경기교육종단연구(GEPS) 중학교 자료를 사용하였고, 데이터정제를 통해 중학교 1학년 499명, 중학교 2학년 486명, 그리고 중학교 3학년 457명을 분석에 투입하였다. 또한 중학생의 학업성취 예측을 위하여 학생수준 394개, 가정수준 45개, 학교수준 106개의 요인을 투입하여 결과를 비교 및 분석 하였다. 결과 연구 결과를 살펴보면 중학교 1·2학년에서는 서포트벡터머신(SVM), 3학년에서는 의사결정나무(C5.0)이 가장 높은 예측 성능을 보였다. 또한, 학업 성취의 주요 예측 요인을 분석한 결과, 모든 학년에서 ‘직전 학년 영어 성적’, ‘영어 수업 이해도’, ‘영어 교과 효능감’, ‘학습 태도’가 중요한 영향 요인으로 확인되었다. 반면, 부모 학력이나 가구 소득과 같은 가정 환경 요인의 영향력은 상대적으로 낮은 경향을 보였다. 특히, 학년이 올라갈수록 학교 환경 요인(학교 만족도, 학급 분위기 등)의 중요성이 점진적으로 증가하는 패턴이 나타났다. 결론 본 연구에서는 여러 머신러닝 기법을 활용하여 중학교 학생의 학년별 영어 과목 학업 성취를 예측하고, 주요 예측 요인을 비교·분석하였다. 또한, 다양한 머신러닝 기법을 비교하여 학년별 최적의 예측 모델을 확인하고, 학업 성취의 주요 영향 요인을 도출하였다. 이러한 연구 결과는 향후 수준별 맞춤형 학습 지원의 기초 자료로 활용될 수 있으며, 개별화된 학습 지원 및 교육정책 수립에 기여할 것으로 기대된다.

Objectives This study aims to predict middle school students' academic achievement in English using various machine learning techniques and to explore the relative importance of key predictive factors by comparing and analyzing them across different grade levels. Methods To achieve this, machine learning techniques such as k-Nearest Neighbors (KNN), Decision Tree (C5.0), Random Forest (RF), Support Vector Machine (SVM), and Neural Network (NNET) were utilized. The predictive accuracy of each model was compared and analyzed for each grade level, and the key predictive factors were identified. To compare academic achievement across grade levels, vertical scale scores for each subject were used. The predictive factors were categorized into three levels: individual, family, and school. For data collection, this study used middle school data from the Gyeonggi Education Panel Study (GEPS). After data preprocessing, a total of 499 first-year, 486 second-year, and 457 third-year middle school students were included in the analysis. In total, 394 individual-level variables, 45 family-level variables, and 106 school-level variables were used to predict students' academic achievement, and the results were compared and analyzed accordingly. Results The findings indicate that Support Vector Machine (SVM) achieved the highest predictive performance for first- and second-year students, while Decision Tree (C5.0) performed best for third-year students. The analysis of key predictive factors revealed that previous-year English grades, English class comprehension, English self-efficacy, and learning attitude were consistently significant predictors across all grade levels. On the other hand, family-related factors such as parental education level and household income had relatively lower predictive power. Additionally, as grade levels increased, the importance of school environment factors (e.g., school satisfaction, classroom atmosphere) showed a gradual increase. Conclusions This study utilized various machine learning techniques to predict English academic achievement among middle school students and to compare key predictive factors across different grade levels. Furthermore, the study identified the most suitable predictive model for each grade level by comparing different machine learning algorithms. These findings provide valuable insights for developing customized learning support systems and can serve as foundational data for personalized education strategies and future education policy development.

Ⅰ. 서론

Ⅱ. 연구 방법

Ⅲ. 연구결과

Ⅳ. 결론 및 제언

참고문헌

(0)

(0)

로딩중