
연관성 규칙 관점에서 수정된 헬링거 측도의 제안
Proposition of Adjusted Hellinger Measure in Association Rule Mining
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.18 No.1
- : KCI등재
- 2016.02
- 199 - 206 (8 pages)
위키 백과사전에 의하면 데이터 마이닝은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 것으로 고객 관계 관리, 신용평가모형 개발, 사기탐지시스템, 장바구니 분석, 최적 포트폴리오 구축 등과 같이 다양한 산업 분야에서 광범위하게 사용되고 있다. 이들 데이터 마이닝 기법 중의 하나인 연관성 규칙은 연관성 평가 기준에 의해 관심 있는 항목들 간에 관련성을 찾아내는 기법으로 많은 연구자들에 의해 평가 기준들이 개발되어 왔다. 이들 중에서 헬링거 측도는 연관성 규칙의 관점에서 볼 때 여러 가지 연관성 측도들에 비해 많은 장점이 있으나 양의 연관성의 정도와 음의 연관성의 정도를 합해서 결과를 도출하기 때문에 연관성의 방향을 판단하기가 곤란한 문제를 내포하고 있다. 이를 해결하기 위해 본 논문에서는 헬링거 측도를 변형한 수정된 헬링거 측도를 제안하고 예제를 통하여 비교하였다. 그 결과, 연관성의 방향을 제시하는 수정된 헬링거 측도가 기존의 측도보다 더 바람직한 것으로 나타났다.
By Wikipedia, data mining is the computational process of discovering patterns in large data sets involving methods at the intersection of artificial intelligence, machine learning, statistics, and database systems. It has been utilized in many industrial sectors such as credit scoring system, fraud detection system, customer relationship management, and decision making. Association rule, one of the well-established methods in data mining, finds the relationship between antecedent items and consequent items in a huge database. Evaluation criteria of association rules have been developed by many researchers. Among them, the Hellinger measure is the association threshold considering the information content and the generality of a rule. If we use the Hellinger measure for rule generation, we cannot determine the direction of the association. In this paper we proposed a adjusted Hellinger measure to compensate for this disadvantage, and we investigated some useful properties for this measure. And then we compared some various aspects through a few experiments. The results showed that the adjusted Hellinger measure was better than the Hellinger measure because it had the right direction of association.
1. 서론
2. 수정된 헬링거 측도의 제안
3. 적용 예제
4. 결론
References