영-불변 측도로서 변형된 불균형 비 측도의 제안
Suggestion of Modified Imbalance Ratio as Null-Invariant Measure
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.21 No.6
-
2019.122941 - 2950 (10 pages)
-
DOI : 10.37727/jkdas.2019.21.6.2941
- 11
데이터 마이닝 분야에서 의미 있는 연관성 규칙 유무를 판정하기 위한 흥미도 측도는 분할표의 빈도 정보 활용 유무에 따라서 구분할 수 있다. 동시 비발생빈도의 정보를 고려하지 않는 영 불변 측도들은 동시 비발생빈도의 정보 없이도 측정이 가능하므로 보다 현실적인 측도라고 할 수 있다. 본 논문에서는 불균형 비 측도의 의미는 함축하면서도 단점을 보완한 변형된 불균형 비 측도를 제안하였으며, 예제를 통해 이에 대한 유용성을 알아보기 위해 불균형 비 측도와 비교해보았다. 그 결과, 동시 발생 빈도가 증가하면 불균형 비 측도와 변형된 불균형 비 측도는 증가하는 것으로 나타났으나 불균형 비 측도는 항상 양으로 나타난 반면에 변형된 불균형 비 측도는 양 또는 음의 취하는 것으로 나타나서 연관성의 방향을 나타내었다. 두 종류의 불일치 빈도의 크기가 증가함에 따라서도 불균형 비 측도와 변형된 불균형 비 측도의 변화 양상을 알아보았는데 이들 두 측도 모두 감소하는 것으로 나타났다. 또한 이 경우에도 불균형 비 측도가 양의 값만을 취하는 것에 비해 변형된 불균형 비 측도는 양 또는 음의 취하므로 변형된 불균형 비 측도는 연관성의 방향을 나타내는 측도인 것으로 나타났다. 또한 측도값의 변화 폭이 크면 클수록 연관성 유무를 판단할 때 도움이 되는데 측도값의 변화 폭도 불균형 비 측도보다 변형된 불균형 비 측도가 더 큰 것으로 나타났다.
Interestingness measures play an important role in big data mining, regardless of the kind of rules and patterns being mined and are intended for selecting and ranking patterns according to their potential interest to the user (Geng, Hamilton, 2006). Interestingness measure for determining whether there is a meaningful association rule in data mining can be classified according to whether frequency information of contingency table is used. Null-invariant measures that do not take into account the information of simultaneous non-occurrence frequency are more realistic because they can be measured without the information of simultaneous non-occurrence frequency. In this paper, we proposed a modified imbalance ratio measure that implies the meaning of imbalance ratio but also compensates for the shortcomings, and compared the imbalance ratio to show its usefulness through examples. As a result, as the co-occurrence frequency (inconsistency frequency) increases, the unbalanced ratio and the modified unbalance ratio increase (decrease), but the imbalance ratio always appears positive while the modified imbalance ratio is positive or negative. Thus the modified imbalance ratio is a good measure for association direction.
1. 서론
2. 변형된 불균형 비 측도의 제안
3. 모의실험의 의한 비교
4. 결론
References
(0)
(0)