상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
161337.jpg
학술대회자료

기업부도 모형 추정시 불균형 및 시계열 데이터에 대한 교차검증 적용방안

  • 261

기업 부도 예측모형에 사용되는 데이터는 정상기업이 부도 사건에 비해 압도적으로 많이 관측되는 대표적인 불균형 데이터(Imbalanced data)이며, 과거 및 현재의 재무변수를 사용하여 부도사건을 예측하는 모형의 특성상 시계열 데이터(Time series data)의 특성을 지니고 있다. 최근 부도예측 모형을 구축하는데 있어 머신러닝 알고리즘을 적용한 방법이 널리 이용되고 있으며, 이 목표 변수의 불균형 문제와 데이터의 시계열적 특성을 반영하는데 있어서 각별한 주의가 필요하다. 이에 본 연구는 기업의 부도를 예측하기 위한 모형을 구축하고 예측능력을 평가하기 위 하여 Random-Oversampling 기법과 SMOTE-Oversampling 기법을 적용하고 데이터의 불균형 문제해결을 위한 방법을 모색하였다. 나아가 전진 교차검증 방안의 적용을 통해 시계열적 특성을 고려하지 않았을 발생할 수 있는 문제를 확인하였다. 실제 데이터를 이용한 부도모형을 구축하 기 위하여 한국거래소에 상장된 기업을 대상으로 실증 분석을 실시 하였고, 다양한 머신러닝 분 류 알고리즘을 적용하여 예측 성능을 비교분석 하였다. 이를 통하여 첫째, 학습데이터의 불균형문제는 Oversampling 기법을 고려해야만 예측모형의 일반화 성능을 확보할 수 있음을 확인하였 다. 하지만, Oversampling 기법 간의 성능 차이는 뚜렷하게 나타나지 않음을 확인하였다. 둘째, 일반적으로 많이 사용하는 K-fold 교차검증과 전진교차검증을 비교한 결과 시간의 흐름에 대한 고려 없이 추정된 모형을 사용하였을 그 예측 성과가 과대 추정될 수 있음을 확인하였고, 이 를 통해 시계열 데이터에 대한 전진교차 검증의 필요성을 보였다. 나아가 부도모형에 대한 머신러닝 알고리즘 적용 시 필요한 절차적 주의사항을 정리하여 실제 모형 적용 시 발생할 수 있는 모델 리스크를 최소화하기 위한 방안을 제시하였다.

로딩중