
이산형 특성변수를 포함한 신용평점모형의 기각추론
Reject Inference of a Credit Scoring Model for Data Including Binary Characteristic Variables
- 이윤지(Yoonji Lee) 송주원(Juwon Song)
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.9 No.6
- 등재여부 : KCI등재
- 2007.12
- 2743 - 2754 (12 pages)
신용평점 모형을 연구할 때 여신의 승인이 기각된 사람들의 자료를 포함한 추론을 기각추론이라 한다. 본 연구에서는 기각추론에서 기각된 사람들의 자료를 결측으로 간주한 후 이 값들을 대체한 후 모수를 추정하는 밀도추정 방법을 이산형 특성 변수를 포함한 모형으로 확장하고자 한다. 밀도추정은 일반적으로 연속형 변수에 관하여 다변량 정규분포를 가정하는데 이를 이산형 특성 변수에 대하여 확장하기 위하여 연속형 잠재 변수를 가정한다. 가정된 잠재 변수를 포함한 전체 자료는 연속형이므로 정규분포를 가정하여 깁스샘플링 기법을 이용하여 모수를 추정하였다. 제안된 방법의 성능을 기존 방법과 비교하기 위한 모의실험을 실시하였고 이 때 기각 비율이 높은 경우 제안된 방법은 기존에 사용된 방법보다 낮은 오분류율을 보이는 것으로 나타났다.
In credit scoring modeling, reject inference indicates an inference based on both rejected and accepted applicants. The credit status of rejected applicants can be considered as missing values. In this study, we extend a density estimation method for reject inference based on Gibbs sampler to handle data with binary variables. First, binary characteristic variables are assumed as a dichotomized version of latent continuous variables. Then, assuming a multivariate normal distribution for continuous characteristic variables and latent continuous variables together, inference is conducted using Gibbs sampler. The suggested approach was compared with commonly used approaches using a simulation. The suggested method performed better than other methods when the proportion of rejection is high.
1. 서론
2. 혼합모형을 통한 기각추론
3. Data Augmentation을 이용한 프로빗 모형의 모수 추정
4. 잠재변수를 이용한 이산형 변수를 포함한 자료에 관한 기각 추론
5. 모의실험(Simulation)
6. 적용 예제: 신용평점 데이터
7. 결론
참고문헌