
오분류율의 붓스트랩추정을 활용한 k-최근접이웃분류의 적용
Application of k-nearest neighborhood classification through bootstrap estimation of misclassification rate
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.7 No.5
- : KCI등재
- 2005.10
- 1643 - 1652 (10 pages)
본 연구에서는 비모수적인 분류방법인 k-최근접이웃분류법을 소개하고, 오분류율을 최소로하는 적절한 k값을 경험적으로 찾아보았다. 오분류율의 추정에 있어서는 단순오분류율의 낙관성편향의 보정을 위해 붓스트랩방법을 활용하였다. 실제자료를 통해 k-최근접이웃분류를 선형/이차판별분류에 비해 좋은 분류법이 될 수 있음을 알아보았으며 오분류율을 최소화하는 기준에서 분류변수의 선택에 적용해 보았다. 모의실험을 통해 k-최근접이웃분류가 자료의 모분포에 적게 영향받을 뿐만 아니라, 적절한 k하에서 효율적인 분석이 될 수 있음을 살펴보았다.
This study introduced k-nearest neighborhood classification which is one of non-parametric classification methods. A proper k for applying k-nearest neighborhood classification was empirically chosen by minimizing misclassification rate. Since apparent error rate brings optimistic bias bootstrap method was used for correcting the bias. Superiority of k-nearest neighborhood classification was shown by empirical study and simulation. Moreover, this study showed that minimizing misclassification rate is also able to be applied for variable selection.
1. 서론
2. 선형판별분류(LDA)와 이차판별분류(QDA)
3. k-최근접이웃분류
4. 붓스트랩방법에 의한 오분류율추정
5. 수치예
6. 결론
참고문헌