상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
커버이미지 없음
KCI등재 학술저널

단조증가 제약식을 가진 단순회귀분석 방법과 응용

Monotonic Constrained Simple Regression and Applications

  • 43

최근 여러 학습모형에서 자료가 가지는 구조를 모형에 반영하기 위한 방안으로 다양한 제약조건들이 활용되고 있다. 본 논문에서는 순서형 범주형 설명변수와 연속형 종속변수를 가진 단순회귀분석모형에서, 모수에 대한 영합(sum to zero) 조건과 단조증가 제약조건을 고려한다. 영합조건은 기준수준을 정하여 추정하는 방식보다 해석적인 면에서 비교우위에 있으며, 단조증가조건은 표본과 모집단과의 상이한 분포로 인해 야기되는 추정량의 편의를 제거하는 데 유용할 수 있다. 연구에서는 순서형 범주형 설명변수의 모수 효과의 크기를 벌점항으로 고려하여, 선형제약식하에서 효율적으로 추정량을 계산하는 알고리즘을 개발하고 이의 특징을 살펴본다. 제안된 방법의 실제 응용사례로써, 2011년 미국 센서스 데이터로부터 학력이 소득에 미치는 영향을 추정하고, 다수준으로 이루어진 학력변수를, 보다 작은 수준수를 가지는 재조합 수준을 가진 범주형 설명변수로 변환하는 방안을 제시한다. 또한, 1990년부터 2008년까지 우리나라의 이산화탄소 배출 총량 데이터에 적용하여 이산화탄소 배출 총량이 단조증가하는 패턴을 확인하고 등위회귀분석(isotonic regression)방법으로의 관련성을 모색한다.

Recently, various constraints have been used as a way to reflect the structure of data in models. In this paper, we consider sum to zero condition and monotonicity constraint of parameters in simple regression model with ordered categorical variable and continuous dependent variables. The sum to zero condition is comparatively advantageous in terms of interpretation rather than that of estimating with a reference level, and monotonicity condition can be useful for the parameter estimation when the distribution of sample is different from population. In this study, we consider a range of parametric effects of ordered categorical variable as a penalty, and develop an algorithm that efficiently calculates the estimator under a linear constraint. As a practical example of the proposed method, we estimate effects of education on income from the US census data in 2011 and convert multilevel categorical variables into categorical variables with a smaller number of levels. In addition, we apply carbon dioxide emission data. We identify increasing pattern of total carbon dioxide emission and note a relation with isotonic regression method.

1. 서론

2. 분석방법론

3. 실제자료 분석

4. 결론