
음의 연관성 규칙 생성을 위한 Jaccard 비유사성 측도들의 고찰
A Study on Jaccard Dissimilarity Measures for Negative Association Rule Generation
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.15 No.6
- : KCI등재
- 2013.12
- 3111 - 3121 (11 pages)
오늘날 스마트 기기의 급속한 보급으로 데이터의 양이 기하급수적으로 증가하게 되었다. 이로 인해 기존에 사용해오던 방법으로는 데이터를 수집하고 분석하는데 한계가 발생함에 따라 빅 데이터 분석의 필요성이 대두되었다. 빅 데이터 분석의 가장 대표적인 기법이 데이터마이닝이며, 이 기법들 중에서 연관성 규칙이 많이 활용되고 있다. 연관성 규칙을 활용하면 항목들 간의 유용한 규칙을 발견할 수 있으며, 또한 이를 수치화 할 수 있어서 다양한 조직에서 합리적인 의사결정을 위해 이용되고 있다. 이러한 연관성 규칙은 크게 양의 연관성과 음의 연관성 규칙으로 나누어 살펴볼 수 있는데, 이들 중에서 음의 연관성 규칙은 항목들 간에 서로 배반의 관계에 있는 항목집합을 탐색하며, 양의 연관성 규칙과 동일하게 음의 지지도, 음의 신뢰도, 음의 향상도 등의 측도를 사용하여 관계를 규명한다. 이들 중에서 지지도와 향상도의 경우에는 전항과 후항이 바뀌더라도 같은 값을 얻을 수 있지만 신뢰도의 경우에는 값이 달라져서 기존의 음의 신뢰도를 가지고는 음의 연관성 규칙을 생성해내는 데 곤란을 겪을 수 있다. 이러한 문제를 해결하기 위해 본 논문에서는 군집분석이나 다차원 분석에서 활용되는 Jaccard 유사성 측도에 대한 여러 가지 유형의 비유사성 측도를 고찰하였으며, 이들을 음의 연관성 규칙을 평가하기 위한 기준으로 적용 가능성 여부를 탐색하였다.
The popularity of smart devices today has led to an exponential growth of data. Therefore, as currently existing way of collecting and handling data came to it’s limit, the need of big data analysis became prominent. A typical technique of big data analysis is data mining, and association rule is largely used among such techniques. Such association rule can be largely divided into positive and negative association rules; negative association rule searches item sets that are in contrary relationship in between items, and also, just as positive association rule, investigates relations using measurements like negative support, negative confidence, and negative lift. From among these, negative support and lift can result in same value when preceding and succeeding items switch places, whereas the value of negative confidence will change, making it difficult creating negative association rule using negative confidence. In this paper, to solve these problems, we studied Jaccard dissimilarity measures used to clustering analysis and multi-dimensional data analysis, and explored their utility as association thresholds for negative association rule.
1. 서론
2. Jaccard 비유사성 측도의 탐색
3. 예제를 통한 고찰
4. 결론
References