상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
커버이미지 없음
KCI등재 학술저널

대칭적 J 측도에 의한 기본적인 연관성 평가 기준의 대체 방안

Alternative Plan of Elementary Association Threshold by Symmetric J Measure

  • 2

연관성 규칙은 빅 데이터 시대에 주목받고 있는 데이터 마이닝 기술 중의 하나로 여러 가지 연관성 평가 기준에 의해 트랜잭션 내의 항목 간의 관련성을 결정하는 기법이다. 일반적으로 향상도가 1 이상인 동시에 사용자가 정한 최소 지지도를 초과하는 것 중에서 신뢰도의 크기에 의해 연관성 규칙 생성 여부를 판단하게 된다. 이 때 항목의 전후 위치에 따라 신뢰도의 크기가 다른 경우에는 합리적으로 연관성 규칙 여부를 판단하기가 곤란하다. 이러한 문제를 해결하기 위해 본 논문에서는 데이터 마이닝의 의사결정나무기법에서 활용되고 있는 엔트로피를 기반으로 한 측도들 중에서 기본적인 연관성 평가 기준을 대체할 수 있는 대칭적 J 측도를 제안하였다. 기존의 J 측도가 두 항목 간의 연관성의 정도를 한 방향으로만 제시하는 반면에 대칭적 J 측도는 양방향의 연관성 강도를 동시에 고려하는 측도이므로 값의 크기도 J 측도보다 클 뿐만 아니라 값의 변화폭도 더 큰 것으로 나타났다. 특히 전항과 후항의 위치를 변경하였을 때 J 측도의 크기가 현저하게 차이가 나는 경우에는 잘못된 연관성 규칙을 생성할 수도 있다는 사실도 예제를 통해 확인하였다.

Association rule is one of the data mining techniques that are attracting attention in the big data age. It is a technique to determine the relationship between items in a transaction by various association evaluation criteria. Generally, it is judged whether or not the association rule is generated by the value of confidence among items having the value of lift of 1 or more and exceeding the minimum support by the user. In this case, it is difficult to judge reasonably whether or not the association rule is satisfied when the value of confidence varies depending on the position of the items. To solve this problem, we proposed a symmetric J measure that can replace the elementary association threshold among the entropy-based measures used in the decision tree method of data mining. While the existing J measure presents the degree of association between the two items in only one direction, the symmetric J measure is a measure that simultaneously considers the strength of the association in both directions, so that the magnitude of the value is larger than the measure. In particular, we have confirmed through examples that we may generate incorrect association rules if the sizes of J measures are significantly different when the positions of items are changed.

1. 서론

2. 대칭적 J 측도의 제안

3. 예제에 의한 비교

4. 결론