
확인적 측도에 의한 연관성 규칙 평가 기준의 제안
Proposition of Confirmed Association Rules
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.15 No.5
- : KCI등재
- 2013.10
- 2527 - 2535 (9 pages)
정부와 다양한 민간 분야에서 빅 데이터의 가치에 주목해 데이터 중심의 해결책 연구와 이와 관련된 역량 육성에 본격적으로 참여하고 있다. 이 시점에서 기존의 정보기술이나 분석 방법론은 새로운 전기를 맞고 있으며, 이들 중 가장 대표적인 기술이 데이터마이닝이다. 데이터마이닝 기법 중에서 연관성규칙은 빅 데이터에 존재하고 있는 항목들 간의 상호 관련성을 찾아내는 기법으로서 항목들 사이의 지지도, 신뢰도, 향상도 등의 흥미도 측도를 기준으로 상호 관련성 여부를 측정한다. 이 측도들 중에서 가장 중심이 되는 것은 신뢰도이다. 그러나 이 신뢰도는 그 값 자체만으로는 연관성의 방향을 알 수 없다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 확인적 측도에 의한 연관성 규칙평가 기준을 제안하는 동시에, 기존의 연관성 평가 기준들과도 비교하였으며, 이들이 흥미도 측도의 조건을 충족하는지의 여부도 점검하였다. 그 결과, 기존의 연관성 규칙보다 확인적 연관성 평가 기준을 활용하는 것이 두 항목 간의 연관성의 정도와 방향을 더 정확하게 나타낸다는 사실을 확인하였다.
By Wikipedia, big data is the term for a collection of data sets so large and complex that it becomes difficult to process using on-hand database management tools or traditional data processing applications. In government and various companies, they are actively participating in big data techniques development. Data mining technique is the method to find useful information in a big database. The methods of data mining are decision tree, association rules, clustering, neural network and so on. One of the well-studied problems in data mining is association rule technique. An association rule mining finds the relation among each items in a big database using elementary interestingness measures such as support, confidence, and lift. But we can not know association direction by these measures. This paper propose confirmed association thresholds to compensate for this problem, and then check the three conditions of interestingness measures. The comparative studies with elementary and confirmed association thresholds are shown by numerical example. The results show that confirmed association thresholds are better than elementary association thresholds.
1. 서론
2. 확인적 연관성 규칙의 평가
3. 예제를 통한 고찰
4. 결론
References