상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
153073.jpg
KCI등재 학술저널

모든 주변비율을 고려한 확률적 흥미도 측도 기반유사성 측도의 한계 설정에 관한 연구

A Study on the Bounds of PIM based Similarity Measures with AMP

  • 2

군집분석은 현업에서 많이 활용되고 있는 데이터 마이닝 기법 중의 하나로 다양한 특성을 내포하고 있는 엄청난 크기의 데이터 집단을 아무런 가정 없이 유사성 측도만을 이용하여 데이터베이스에 포함되어 있는 객체를 비슷한 군으로 묶는 기법이다. 본 논문에서는 유사성의 정도와 방향을 동시에 나타내주는 확률적 흥미도 측도 기반 유사성 측도들 중에서 모든 주변 비율을 고려한 측도들에 대해 대소 관계를 수학적으로 규명하는 동시에 실제 데이터와 모의실험 데이터를 이용하여 좀 더 구체적으로 측도들 간의 관계를 살펴보았다. 실제 데이터를 분석한 결과, SCohen, SMP, SPhi, 그리고 SFleiss는 PIM과 동일한 부호를 가지는 반면에 Sphi의 제곱인 SDoo는 모든 경우에 양의 값으로 나타났다. 또한 측도들의 절대값의 크기를 오름차순으로 정리하면 SDoo, SCohen, SMP, SPhi,SFleiss 의 순으로 나타나는 사실을 수학적으로 증명하였다. 모의실험을 통해 SDooSCohen의 대소 관계를 좀 더 구체적으로 알아본 결과, SDoo를 제외한 모든 측도들이 PIM과 동일한 부호를 가지는 것을 알 수 있으며, PIM이 양의 값을 갖는 경우 각 측도들의 절대값의 크기는 SDoo, SCohen, SMP, SPhi, SFleiss의 순으로 나타났다. 그러나 PIM이 음인 경우 동일 방향 빈도에 비해 반대 방향 빈도가 현격하게 크게 되면 SDoo와 의 SCohen순위가 뒤바뀐다는 사실을 확인하였다.

Cluster analysis is one of many data mining techniques that are utilized in the work site operations. By Wikipedia, it is the task of grouping a set of objects in such a way that objects in the same group are more similar to each other than to those in other groups. In this paper, we computed bounds for similarity measures based on the probabilistic interestingness measure with all marginal probability, and compared these measures by real data and simulated experiment. The results are as follows : (1) SCohen, SMP, SPhi, and SFleiss have the same sign with PIM, but SDoo has a positive value in all cases. (2) If PIM has a positive value, the ascending order of the absolute values is SDoo, SCohen, SMP, SPhi, and SFleiss. (3) If PIM has a negative value, and the product of the frequencies in the opposite direction is significantly larger than that in the same direction, the ascending order is SDoo, SCohen, SMP, SPhi, and SFleiss. From these results, we confirmed that the bounds of similarity measures provided means of classifying various measures.

1. 서론

2. 주변비율 전부를 고려한 PIM 기반 측도들의 대소 관계

3. 사례를 통한 대소 관계 탐색

4. 결론

References

로딩중