
연관성 규칙 평가를 위한 순수 부호 헬링거 측도
Proposition of Pure Signed Hellinger Measure as Association Rule Threshold
- 박희창(Hee-Chang Park)
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.18 No.5
- 등재여부 : KCI등재
- 2016.10
- 2477 - 2484 (8 pages)
본 논문에서는 연관성 평가 기준 중에서도 헬링거 측도와 부호 헬링거 측도에 비해 보다 현실적인 연관성 규칙 평가 기준인 순수 부호 헬링거 측도를 제안하고 흥미도 측도의 조건 만족 여부를 검토하였으며, 예제를 통하여 제안한 측도의 유용성을 살펴보았다. 그 결과, 동시 발생 빈도와 동시 비 발생 빈도는 증가(감소)하고 불일치 빈도가 감소(증가)함에 따라 헬링거 측도는 특정 케이스 이전에는 감소하다가 그 이후부터는 증가한 반면에 부호 헬링거 측도와 순수 부호 헬링거 측도는 전체적으로 증가(감소)하는 경향을 나타내었다. 이는 헬링거 측도가 흥미도 측도의 조건을 충족하지 못하는 반면에 부호 헬링거 측도 및 순수 부호 헬링거 측도는 조건을 충족한다는 것을 의미한다. 부호 헬링거 측도와 순수 부호 헬링거 측도를 비교해보면 후자가 전자보다 값이 더 큰 동시에 각 경우의 값의 차이가 크게 나타나고 있으므로 연관성의 강도를 더 잘 표현한다고 할 수 있다. 따라서 순수 부호 헬링거 측도가 부호 헬링거 측도 보다 연관성 평가 기준으로 더 바람직하다는 결론을 내릴 수 있다.
By Wikipedia, association rule learning is a method for discovering interesting relations between variables in large databases, and is intended to identify strong rules discovered in databases using association rule thresholds. These measures have been developed by many researchers. Among them, Hellinger measure is the threshold considering the information content and the association rule generality. But we cannot determine the direction of the association by Hellinger measure. In this paper we proposed a pure signed Hellinger measure for more realistic assessment. Furthermore, we proved the conditions of association threshold, and investigated some aspects for this measure through a few examples. The results showed that the pure signed Hellinger measure was better than the Hellinger measure because our measure was able to estimate the right direction of association, and was better than the signed Hellinger measure because of value size and the gap of values between two cases.
1. 서론
2. 순수 부호 헬링거 측도
3. 적용 예제
4. 결론
References