상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
커버이미지 없음
KCI등재 학술저널

연관성 파악을 위한 변형된 대칭적 헬링거 측도의 탐색

Exploring Modified Symmetric Hellinger s Measures for the Generation of Association Rules

  • 2

데이터 마이닝 기법 가운데 현업에서 많이 활용되고 있는 연관성 규칙은 데이터베이스에 있는 항목들 간에 관련성을 찾아내는 기법이므로 많은 연구자들에 의해 연관성 평가 기준들이 개발되고 있다. 본 논문에서는 여러 가지 연관성 평가 기준인 흥미도 측도 중에서 헬링거 함수를 응용한 측도를 제안하고자 한다. 헬링거 측도는 현재까지 개발된 연관성 측도들에 비해 여러 가지 장점은 있으나 연관성의 한쪽 방향만을 고려함으로써 연관성 평가 결과가 왜곡되게 나타날 수 있다. 본 논문에서는 이러한 문제를 해결하고자 대칭적 헬링거 측도를 변형하여 여러 종류의 대칭적 헬링거 측도를 고안하여 제시하고, 예제를 이용하여 동시 발생 빈도와 불일치 빈도 등에 따른 변화를 비교해봄으로써 유용성을 탐색해보았다. 동시 발생 빈도가 증가하면 양의 연관성의 크기는 증가해야 하고, 불일치 빈도가 증가하게 되면 양의 연관성의 크기가 증가해야 한다. 예제를 통한 실험 결과, 대칭적 부호 헬링거 측도, 조정된 대칭적 헬링거 측도, 그리고 조정된 대칭적 부호 헬링거 측도 중에서 조정된 대칭적 부호 헬링거 측도가 연관성의 정도와 방향을 가장 잘 표현해주므로 연관성 측도로서는 가장 바람직한 것으로 나타났다.

The association rule mining that is widely used in the field of data mining is a method of finding the degree of association among the items in the database, so that many researchers have developed association thresholds. In this paper, we propose some measures applying the Hellinger function among interestingness measures. The Hellinger measure has several advantages over the association mesures developed so far, but the association evaluation result may be distorted by considering only one direction of the association. We have devised various modified symmetric Hellinger measures such as symmetric sign Hellinger measure, adjusted symmetric Hellinger measure, and adjusted symmetric sign Hellinger measure to solve this problem, and tried to explore the usefulness by comparing them with examples. As a result, the adjusted symmetric sign Hellinger measure showed the best association threshold because it showed the degree and direction of the association.

1. 서론

2. 대칭적 헬링거 측도의 변환

3. 적용 사례

4. 결론

References