흥미도 측도로서의 균형된 기여 순수 신뢰도의 제안
Proposition of the Balanced and Attributable Net Confidence in Association Rule Mining
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.16 No.3
- : KCI등재
- 2014.06
- 1327 - 1335 (9 pages)
데이터마이닝 분야에서 널리 활용되고 있는 연관성 규칙 기법은 항목들 간의 지지도, 신뢰도 그리고 향상도 등의 흥미도 측도를 근거로 하여 관련성 여부를 측정한다. 이들 중에서 가장 많이 활용되고 있는 측도가 신뢰도인데, 이를 이용하면 연관성의 방향을 파악할 수가 없다. 이러한 단점을 보완하기 위해 순수 신뢰도와 기여 순수 신뢰도가 제안되었다. 그러나 이들은 단지 항목이 발생하는 부분에 대해서만 기술한 측도이므로 비 발생 부분에 대한 것은 고려하지 않고 있어서 균형된 흥미도 측도라고 보기에는 무리가 따른다. 이에 본 논문에서는 항목의 발생 부분뿐만 아니라 비 발생 부분도 동시에 고려한 측도인 균형된 기여 순수 신뢰도를 제안하였으며, 예제를 이용하여 여러 가지 신뢰도들을 비교하여 본 논문에서 고려하는 측도의 유용성에 대해 알아보았다. 그 결과, 연관성 규칙 생성의 관점에서 볼 때, 균형된 기여 순수 신뢰도가 순수 신뢰도와 기여 순수 신뢰도보다 더 의미 있는 측도인지를 파악할 수 있었다. 또한 Piatetsky-Shapiro(1991)가 제안한 흥미도 측도의 기준에 대한 충족여부를 증명하였다.
Recently, we have witnessed a dramatic growth in our ability to collect data from various devices in different formats. Big data mining is the capability of extracting meaningful information from very huge databases or streaming data that due to its variability, velocity, or volume, it is not possible before to do it. The most widely used data mining method is to generate association rules. This technique finds the relationship among some item sets in a big database using association criteria such as support, confidence, and lift. Among these measures, confidence is the most frequently used, but it has the drawback that it can not express the direction of the association. The net confidence and the attributably pure confidence were developed to get rid of this drawback. But the former is useless in the case that the value of positive confidence is the same as that of negative confidence, or the latter is not a balanced measure because it the measure considering only occurrence part. In this paper, we propose the balanced and attributable net confidence considering simultaneously occurrence and non-occurrence part. A comparative study among confidence, the net confidence, the attributably pure confidence, and the balanced and attributable net confidence was shown by numerical example. The results showed that the balanced and attributable net confidence is better than others.
1. 서론
2. 균형된 기여 순수 신뢰도의 제안
3. 적용 예제
4. 결론