상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
153042.jpg
KCI등재 학술저널

항목 빈발 회수의 상대적 크기를 고려한 대칭적 신뢰도의 제안

Proposition of Symmetric Confidence Considering Relative Size of Item Frequencies

  • 3

연관성 규칙은 데이터마이닝 분야에서 가장 많이 활용되고 있으며, 방대한 양의 데이터베이스 속에 있는 각 항목들 간의 관련성을 수치화함으로써 두 개 이상의 항목간의 관련성을 나타내는 기법이다. 이러한 연관성 규칙 기법은 결과변수가 존재하지 않으며, 시간의 순서를 고려하지 않는 비목적성 분석기법이다. 의미 있는 연관성 규칙을 탐색하기 위한 가장 기본적인 흥미도 측도에는 지지도, 신뢰도, 향상도 등이 있으며, 이들을 이용하여 연관성 규칙을 생성하게 된다. 이 때 사용되는 지지도와 향상도는 대칭적인 측도이나 신뢰도는 비대칭적 측도이다. 기존의 연관성 규칙 생성에서는 한 방향으로의 신뢰도만을 이용하여 연관성 규칙의 생성여부를 판단하게 되면 잘못된 결론에 다다를 수 있으므로 본 논문에서는 주변 확률의 상대적 크기를 고려한 대칭적 신뢰도를 제안한 후, 구체적인 예제를 통하여 기존의 신뢰도와 대칭적 신뢰도의 변화하는 양상을 통해 이들을 비교하였다. 그 결과, 대칭적 신뢰도는 두 신뢰도 값의 사이에 위치하게 되며, 항목의 빈발 횟수가 크게 차이가 날수록 대칭적 신뢰도는 빈발횟수가 큰 쪽의 신뢰도에 확연하게 접근된 값을 가지는 것을 확인할 수 있었다.

One of the well-studied problems in data mining is the search for association rules. The task of association rule mining is to find certain association relationships among a set of data items in a huge database. Association rule is a unsupervised method not to consider time sequence and there are no target variables in database for association rule. There are three primary quality measures for association rule, support and confidence and lift. Support and lift are symmetric measures for association rule exploration, but confidence is an asymmetric measure. We may reach the wrong conclusion because we use only one way confidence under current technique for association rule generation. In this paper we propose a symmetric confidence considering relative size of item frequencies and then compare the confidence and symmetric confidence using some concrete examples. As the result, we knew that the symmetric confidence has a value between two confidences and has a remarkably near value to the confidence for more item frequencies

1. 서론

2. 대칭적 연관성 규칙

3. 예제를 통한 고찰

4. 결론

참고문헌

로딩중