
판정보류 옵션을 가진 분류자
A Classifier with a Reject Option
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.12 No.6
- : KCI등재
- 2010.12
- 3317 - 3325 (9 pages)
이범주 분류문제에서 판정보류 옵션을 가진 분류규칙은 기존의 분류규칙에 판정보류 옵션을 추가적으로 고려한 분류규칙을 의미한다. 이러한 판정보류 옵션을 가진 분류규칙은 엄밀히 분류를 하기 힘든 자료에 대해 기존의 분류방법보다 더 우수한 성능을 보이는 것으로 알려져 있다. 기계학습적인 판정보류 옵션을 가진 방법은 최근에서야 support vector machines(SVM) 방법을 기저로 하여 개발되었다. 그러나, 근본적으로 SVM방법이 사후확률을 제공하지 못하기 때문에 이에 근거한 판정보류 옵션을 가진 SVM방법도 역시 동일한 문제를 안고 있다. 본 연구에서는 사후확률을 도출하는 통합손실함수를 소개하고, 이를 판정보류에 활용하여 기존 방법론들의 단점을 개선하고자 한다. 또한, 실제 자료를 통하여 제안한 방법론의 유용성을 실증한다.
In classification problem, it would be desirable to defer a decision in particular for observations which are hard to classify. For example, an observation whose conditional probability is around 1/2, it would be better to take more advanced tests rather than to make a decision right away. This motivates a classifier with a reject option that reports a warning for those observations that are hard to classify. Recently, learning methods with a reject option have been developed based on support vector machines(SVM). But, SVM with a reject option doesn’t provide posterior probability. To tackle such a limitation, in this paper, we propose a machine learning approach using the unified loss function. We develop an optimization algorithm for the proposed method, which is fast enough to analyze large scale data. Results of numerical studies show that the proposed method efficiently reduces prediction errors compared with the traditional SVM with a reject option.
1. 서론
2. 판정보류 옵션을 가진 분류방법
3. 자료분석
4. 결론 및 토의
참고문헌