
깁스 샘플러를 이용한 신용평점모형의 기각추론
Reject Inference of Credit Scoring Model using Gibbs Sampler
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.9 No.5
- : KCI등재
- 2007.10
- 2305 - 2319 (15 pages)
신용평점에서 이용되는 모형을 개발하기 위해서는 여신의 신청이 승인된 사람들과 기각된 사람들의 사후 신용 상태에 대한 정보가 필요하다. 그러나 기각된 사람들의 자료는 사후 관리가 되지 않지 않기 때문에 신용상태를 파악할 수 없다. 그러므로 정확한 모형을 개발하기 위해서는 기각된 사람들을 포함한 추론이 필요하며 이를 기각추론이라 한다. 본 연구에서는 기각추론에서 기각된 사람들의 데이터를 결측이라 간주한 후 깁스샘플러를 이용하여 이 값들을 대체한 후 모수를 추정하는 방법을 제안한다. 이 방법의 타당성을 확인하기 위하여 모의실험을 실시하여 로지스틱 회귀에 의한 추정방법과 EM 알고리즘에 의한 추정방법과 비교하였다. 또한 실제 데이터에 적용하여 모수를 추정하여 기각추론 전 후의 우량 고객과 불량 고객의 분포에 어떤 차이가 있는지 살펴본다.
To develop a credit scoring model, it is necessary to collect the final credit status of both accepted and rejected applicants. However, the credit status of the rejected applicants is unknown since they did not receive the loan. To develop an accurate credit scoring model, it is necessary to conduct inference based on both rejected and accepted applicants, and inference based on both applicants are called reject inference. In this article, we treat the credit status of rejected applicants as missing values and impute them using Gibbs sampler. Then parameters can be estimated by using imputed credit status. To evaluate the suggested method, a simulation study was conducted. The result of reject inference based on Gibbs sampler was compared with the one based on the EM algorithm as well as the result of function estimation using a logistic regression. The suggested method were also applied in an example data.
1. 서론
2. 기각추론
3. 모의실험
4. 적용 예제: 신용평점 데이터
5. 토론
참고문헌