
연관성 규칙 생성을 위한 상대적 대칭 가중 순수 신뢰도의 제안
Proposition of Relatively and Symmetrically Weighted Net Confidence in Association Rule Mining
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.17 No.5
- : KCI등재
- 2015.10
- 2423 - 2431 (9 pages)
데이터 마이닝은 방대한 데이터베이스에 내재되어 있는 유용한 정보를 탐색하는 기법으로 최근 많은 산업 분야뿐만 아니라 정부조직에서도 많이 활용하고 있다. 이 기법 중에서 연관성 규칙은 평가 기준에 의해 항목들 간에 관련성을 찾아내는 기법이다. 본 논문에서는 보다 합리적인 연관성 규칙을 생성하기 위해 대칭적 가중 순수 신뢰도에 대해 각 항목의 주변 확률의 합을 고려한 상대적 대칭 가중 순수 신뢰도를 제안하였다. 또한 제안된 측도에 대해 평가 기준의 조건 충족 여부를 증명하였고, 예제를 통하여 기존의 측도들과의 비교를 통해 그 유용성을 살펴보았다. 그 결과, 순수 신뢰도는 연관성의 방향을 나타내기는 하나 양의 신뢰도와 음의 신뢰도의 차이만을 고려하는 측도이기 때문에 두 값의 차이가 동일하면 이들의 값도 동일하게 된다. 대칭적 가중 순수 신뢰도는 이러한 단점이 보완되었으나 행태적인 해석이 어려운 사실을 발견하였다. 반면에 상대적 대칭 가중 순수 신뢰도는 연관성의 방향을 나타내는 동시에 행태적인 해석이 가능하며, 두 순수 신뢰도 값의 사이에 있는 값으로 나타나서 양 방향의 순수한 연관성 강도를 합리적으로 표현한다는 사실을 확인하였다.
Data mining is a technique of exploring useful information in a huge database, and has been utilized in many government organizations, as well as many industrial sectors. Association rule, one of the well-studied techniques in data mining, finds the relationship among item sets in a database. In this paper, we proposed a relatively and symmetrically weighted net confidence considering the sum of the marginal probabilities of each item on the symmetrically weighted net confidence to create more rational association rules. We proved whether satisfy the evaluation criteria for the proposed measure, and compared this measure with some confidence measures through a few experiments. The results showed that the relatively and symmetrically weighted net indicated the direction of association rules, and could be operational interpretation, and had the values between the two net confidences. Thus we think this measure as more desirable than the traditional confidence measures.
1. 서론
2. 상대적 대칭 가중 순수 신뢰도의 제안
3. 적용 예제
4. 결론
References