상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
한국자료분석학회 2022년 하계학술대회 발표집.jpg
학술대회자료

재정데이터 내의 이상치 탐지를 위한 비지도 방법의 성능 비교

이상치 탐지란 정상 데이터의 분포 밖에 있는 이상치를 탐지하는 것으로, 지도, 준지도 그리고 비지도 방법이 존재하며, 이중 비지도 방법은 레이블링 된 데이터 확보가 어려운 다양한 분야에 적용될 수 있는 방법이다. 최근 우리은행 등 내부자 부정행위가 사회적 이슈로 대두되며 내부통제 시스템에 활용될 수 있는 재정 데이터에 대한 이상치 탐지 분야의 수요가 가파르게 상승하고 있는 반면, 재정 데이터의 비밀성, 비공개성 및 레이블 확보의 어려움으로 관련 연구는 부족한 상황이다. 이에 본 논문은 2001년 말 부정회계 사건 등으로 파산한 미국 Enron사의 실전재정 데이터를 활용하여 이전 연구에서 다뤄졌던 비지도 이상치 탐지 방법들과 본 논문에서 제안하는 Feature Relevance based Unsupervised Feature Selection(FRUFS)와 앙상블 기법을 결합한 방법의 결과를 비교분석 하였다. 실험에는 기존의 비지도 이상치 탐지 방법들로 Local Outlier Factor(LOF,) Isolation Forest, One-Class Support Vector Machine(OC-SVM), AutoEncoder 등 총 4가지를 활용하였으며, 실험 결과 본 논문에서 제안한 방법이 이전 비지도 이상치 탐지 방법들을 정확도와 F1 Score 모두에서 능가하였다.

1. 서론

2. 이전 연구

3. 실험 방법

4. 실험 결과

5. 결론

References