최근 검색어 전체 삭제
KCI등재 학술저널

머신러닝 기반 청년의 진로상태 예측모델 개발

Development of Prediction Model for Career Status of Young Adults Using Machine Learning

  • 67

이 연구는 청년의 진로상태 여부를 예측하는 모형을 개발한 뒤, 해당 모형에서 진로상태를 예측하는 주요 변인이 무엇인지 구명하고, 미취업자, 취업자 및 구직자, 대학생 이상 집단 간 어떤 차이가 있는지 분석하는 데 목적이 있다. 이를 위해 2020년에 수집된 2005한국교육종단연구 12차연도 데이터를 활용하였고, 응답유형에 따라 집단 수준을 미취업자, 취업 및 구직자, 대학생 이상 집단으로 설정하였다. 사용된 머신러닝 알고리즘은 의사결정나무 모델, 랜덤포레스트, XGBoost였으며, 모델 구현결과 랜덤포레스트 알고리즘이 청년의 진로상태를 가장 우수히 예측(90.23%)하는 것으로 나타났다. 해당 모델에서 도출된 중요도 상위 10개 변인은 ‘이성교제 시간’,‘삶의 질 만족도’,‘사회적관계_도움’,‘생산적 시간’,‘일상시간’,‘시민의식_적극참여’,‘사회적관계_친구’,‘시민의식_법규준수’,‘취업준비노력’, ‘진로성숙도_계획수립형’으로 도출되었다. 특히 ‘이성교제 시간’변인은 다른 변인에 비해 중요도가 매우 높았으며, 여타모델에서도 집단을 분류하는 가장 중요한 변인으로 나타났다. ‘삶의 질 만족도’,‘사회적관계_친구’변인 또한 모든 모델에서 주요 변인으로 나타났다. 그러나 해당 변인들에 대한 실증적인 연구는 아직 많지 않으므로‘시간활용’,‘삶의 질 만족’,‘시민의식’등의 변인이 진로와 관련하여 어떠한 연관성이 있는지 밝히는 후속 연구와 함께, 시간활용도 청년들의 진로설계나 진로상담에 활용될 필요가 있음을 제안한다.

This study intends to develop a prediction model for the career status of young adults, investigate primary factors predicting their career status of the model, and identify the difference between the career groups. To do this, Korean Education Longitudinal Study 2005(KELS 2005) 12th data collected in 2020 was used, and the group was separated into the level of the unemployed, the employed or the job seeker, and the higher education students by responding types. The algorithms used in machine learning were the decision tree, random forest, and XGBoost. As a result, it was found that the random forest model was the best algorithm for predicting the current job status of adults(90.23%). Furthermore, the top 10 prediction variables extracted in this model were ‘dating time’, ‘life quality satisfaction’, ‘social relationship_help’, ‘productive time’, ‘daily time’, ‘citizenship_participation’, ‘social relationship_friends’, ‘citizenship_compliance’, ‘job preparation efforts’, and ‘career maturity_planning’. Especially the ‘dating time’ was the extremely important variable compared to the other variables to the point where the primary variable to divide into groups in every other model. And the ‘life quality satisfaction’ and ‘social relationship_friends’ also were primary variables to divide into groups in every other model. Therefore, an additional study was recommended for identifying relationships between time management, life quality satisfaction, citizenship, and career because few studies have proceeded.

I. 서론

II. 이론적 배경

III. 연구방법

V. 결론 및 논의

VI. 제언
