
학술대회자료
재정데이터 내의 이상치 탐지를 위한 비지도 방법의 성능 비교
- 한국자료분석학회
- 한국자료분석학회 학술대회자료집
- 2022년 하계학술대회 발표집
- 2022.07
- 215 - 218 (4 pages)
이상치 탐지란 정상 데이터의 분포 밖에 있는 이상치를 탐지하는 것으로, 지도, 준지도 그리고 비지도 방법이 존재하며, 이중 비지도 방법은 레이블링 된 데이터 확보가 어려운 다양한 분야에 적용될 수 있는 방법이다. 최근 우리은행 등 내부자 부정행위가 사회적 이슈로 대두되며 내부통제 시스템에 활용될 수 있는 재정 데이터에 대한 이상치 탐지 분야의 수요가 가파르게 상승하고 있는 반면, 재정 데이터의 비밀성, 비공개성 및 레이블 확보의 어려움으로 관련 연구는 부족한 상황이다. 이에 본 논문은 2001년 말 부정회계 사건 등으로 파산한 미국 Enron사의 실전재정 데이터를 활용하여 이전 연구에서 다뤄졌던 비지도 이상치 탐지 방법들과 본 논문에서 제안하는 Feature Relevance based Unsupervised Feature Selection(FRUFS)와 앙상블 기법을 결합한 방법의 결과를 비교분석 하였다. 실험에는 기존의 비지도 이상치 탐지 방법들로 Local Outlier Factor(LOF,) Isolation Forest, One-Class Support Vector Machine(OC-SVM), AutoEncoder 등 총 4가지를 활용하였으며, 실험 결과 본 논문에서 제안한 방법이 이전 비지도 이상치 탐지 방법들을 정확도와 F1 Score 모두에서 능가하였다.
1. 서론
2. 이전 연구
3. 실험 방법
4. 실험 결과
5. 결론
References