
균형 확인적 연관성 평가 기준의 제안
Proposition of Balanced and Confirmed Thresholds in Association Rules
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.16 No.4
- : KCI등재
- 2014.08
- 1885 - 1895 (11 pages)
오늘날 다양한 종류의 이용 가능한 대규모 데이터의 발생으로 인하여 각종 기업 및 조직에서는 경쟁력 제고를 위해 빅 데이터에 대한 관심이 집중되고 있다. 이러한 빅 데이터에 가장 많이 활용되고 있는 기법이 데이터마이닝이다. 특히 데이터마이닝 기법들 중에서도 연관성 규칙은 항목들 간의 지지도, 신뢰도, 그리고 향상도를 기반으로 하여 빅 데이터에 포함되어 있는 항목들 간의 관련성을 탐색하는 데 활용되고 있다. 그러나 이들 기본적인 연관성 평가 기준만으로는 연관성의 방향을 알 수가 없어서 확인적 연관성 규칙에 대한 평가 측도가 제안되었으나 이들은 연관성의 방향을 제대로 나타내지 않는 경우가 종종 발생한다. 본 논문에서는 이러한 문제점을 보완한 균형 확인적 연관성 규칙의 평가 기준을 제안하였다. 또한 이들이 흥미도 측도의 조건을 충족하는지를 조사하였으며, 예제를 통하여 균형 확인적 연관성 규칙의 유용성에 대해 알아보았다. 그 결과, 기본적인 연관성 측도나 확인적 연관성 측도보다 균형 확인적 연관성 측도를 평가 기준으로 활용하는 것이 항목 간의 연관성의 정도와 방향을 더 정확하게 나타낸다는 것을 규명할 수 있었다.
Due to the wide variety of large scale data, attention for big data has been concentrated to enhance the competitiveness in various companies and organizations. The most commonly utilized technique for big data is data mining. In particular, association rule of data mining techniques finds the relation among each items in a big database using elementary interestingness measures such as support, confidence, and lift. But we can not know association direction by these measures. So, confirmed association rule thresholds were proposed to compensate for this problem, But we can not determine accurately the direction of association by them. This paper propose a balanced and confirmed association rule to solve these problems, and then check the three conditions of interestingness measures by Piatetsky-Shapiro (1991). The comparative studies with elementary, confirmed association, and balanced and confirmed association thresholds are shown by numerical example. The results show that balanced and confirmed association thresholds are better than elementary and confirmed association thresholds.
1. 서론
2. 균형 확인적 연관성 규칙 평가 기준
3. 예제를 통한 고찰
4. 결론
References