
한국고용정보원의 청년패널자료를 중심으로 한 학생수면시간 관련 주요인자탐색연구
A Study to Explore Factors related to Sleep Duration among Students based on 2009 Young Penal Data from Korea Employment Information Service
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.15 No.2
- : KCI등재
- 2013.04
- 785 - 798 (14 pages)
본 연구에서는 한국고용정보원의 청년패널 2009년 자료로부터 고등학생과 대학생의 수면시간에 관심을 갖고, 이를 바탕으로 학생들의 수면시간과 연관성이 있는 주요변수에 대하여 연구하였다. 일반적으로 설명변수의 수가 큰 선형모형의 경우 과적합으로 인하여 예측오차가 증가될 수 있다. 이런 문제를 해결하기 위한 방법으로는 주로 변수선택법(variable selection)과 벌점화 방법(method of penalization or regularization)이 적용된다. 변수선택법은 설명변수의 수를 줄이는 방법이고, 벌점화 방법은 모형에 모든 설병변수를 사용하되 회귀계수에 제약을 두는 방법이다. 본 연구에서는 변수선택법으로 단계적 선택법과 Efroymson(1960)이 제안한 단계적 순열을 이용한 정보기준 사용법(best sequence method)을, 그리고 벌점화 방법으로는 Yuan, Lin(2006)이 제안한 group LASSO를 사용하여 수면시간과 연관이 있는 주요변수를 선택하고 그 결과들을 비교 평가하였다. group LASSO 방법을 기준으로 수면시간에 영향을 미치는 주요변수들을 비교해보면, 고등학생의 경우에는 진로상담경험, 음주정도, 스트레스유무, 지역, 진로의 명확성, 사교육 경험 등의 변수가 선택되었고 대학생의 경우에는 건강상태, 음주정도, 학교생활만족도, 우울유무, 지역등의 변수가 선택되었다. 이들 결과를 살펴보면 고등학생은 대학교 진학과 관련된 변수들이 유의하게 선택되는 경향이 있는 것을 알 수 있었다.
In this paper, based on youth panel data published by Korea Employment Information Service in 2009, we are interested in exploring factors related to sleep duration among high-school and university students. Many predictor variables in linear models may cause overfitting problem leading to large prediction error. Two general remedies are available: variable selection and regularization (Hastie, 2009). In this paper, we consider stepwise selection method and best sequence method proposed by Efroymoson (1960) as variable selection methods and also consider group LASSO method proposed by Yuan and Lin (2006) as a method of regularization. We present a real data analysis to compare these methods and discuss the factors related to sleep duration. For high school students, the variables related to career counseling, drinking, stress, area, clarity of career achievement, private education are selected as significant. Most variables are related to college entrance. In the meantime, the variables related to health, drinking, satisfaction of school life, and gloom are significant for university students.
1. 서론
2. 주요변수선택법
3. 실제자료분석
4. 결론
References