국가지식-학술정보
혼합형 데이터에 대한 나무형 군집화
Tree-structured Clustering for Mixed Data
- 한국통계학회
- The Korean Journal of Applied Statistics
- Vol.19 No.2
-
2006.01271 - 282 (12 pages)
- 0
커버이미지 없음
본 논문에서는 범주형과 연속형 변수들이 혼합된 데이터에 적용할 수 있는 나무형 군집화 알고리즘을 제안하였다. 특히 혼합된 변수들이 공통의 의미를 갖도록 하기 위해 범주형 변수들을 전처리하는 방법을 고안하였다. 수치 예로서 SPSS의 신용(credit) 데이터와 독일신용자료(German credit data)에 알고리즘을 적용하고 그 결과를 검토하였다.
The aim of this study is to propose a tree-structured clustering for mixed data. We suggest a scaling method to reduce the variable selection bias among categorical variables. In numerical examples such as credit data, German credit data, we note several differences between tree-structured clustering and K-means clustering.
(0)
(0)