상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
커버이미지 없음
KCI등재 학술저널

결측이 있는 신용평가 자료의 희소사건 로지스틱 회귀분석

Rare Bankruptcy Event Prediction with Missing Data

DOI : 10.37727/jkdas.2017.19.1.129
  • 115

기업이나 개인의 파산여부에 대한 예측은 은행의 대출에 관한 의사결정시 주요 지표로 활용되어왔다. 본 논문에서는 파산여부 자료의 통계 분석과정에서 주의를 필요로 하는 두 가지 특징을 가진다. 첫째, 자료의 종속변수인 파산여부는 희소사건이다. 희소사건의 발생확률을 예측하기 위하여 로지스틱 회귀모형에 일반적인 최대우도 추정법을 적용하는 경우 회귀계수 추정치에 편향이 발생하여 사건의 예측확률이 과소추정 되는 경향을 가진다. 대부자의 입장에서는 파산가능성을 과소추정하여 상환불이행 등을 통한 손실을 입는 가능성이 높아지게 된다. 둘째, 파산여부 자료에는 결측이 존재할 가능성이 높다. 결측치가 없는 완전자료를 사용하는 경우 자료의 손실로 인한 모형의 정확도가 감소하고 모형 추정과정에서 편향이 발생할 수 있다. 본 논문에서는 파산여부 예측모형에서 발생할 것으로 예상되는 편의들의 보정방법과 모의실험을 통한 보정방법의 효용성을 검증하였다.

Predicting bankruptcy has played an important role in credit evaluation. In particular, it is an indicator that has been used mainly in making decisions on bank loans. Bankruptcy data have two characteristics that require attention in statistical analysis. First, bankruptcy, a response variable of data, is a rare event. When the plain maximum likelihood estimation method is applied to the logistic regression model which predicts the probability of a rare event, the probability of occurrence tends to be underestimated due to bias of the regression coefficient estimate. Then, the lender can underestimate the possibility of bankruptcy and suffer losses due to lack of payment. Second, there may be missing value in the bankruptcy data. In the case of using only the complete case data, the accuracy of the model decreases. In addition, bias of estimate may arise in the model estimate. In this paper, we verify the effectiveness of the bias correction method of the bankruptcy prediction model through simulation studies.

1. 서론

2. 결측치의 발생방식 및 결측패턴

3. 결측대체

4. 희소 사건 로지스틱 모형 추정

5. 모의실험

6. 결론

로딩중