상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
커버이미지 없음
KCI등재 학술저널

연관성 규칙 마이닝에서의 수정된 대칭적 J 측도의 활용 방안

Application of Modified Symmetric J Measure in Association Rule Mining

DOI : 10.37727/jkdas.2017.19.5.2481
  • 6

오늘날 정보통신기술의 발달과 모바일 기기 이용의 확산에 의해 데이터가 폭증하게 됨으로써 빅 데이터의 환경이 도래하였으며, 이를 분석하기 위해 여러 가지 데이터 마이닝 기법이 개발되고 있다(Park, 2017a). 데이터 마이닝은 빅 데이터에 내재되어 있는 규칙이나 정보를 탐색하는 기술로, 연관성 규칙, 의사결정나무, 군집분석, 신경망 등 여러 가지 기법이 있다. 본 논문에서는 연관성 규칙 마이닝에서 이용되는 객관적 흥미도 측도 중에서 교차 엔트로피로 불리는 J 측도를 응용한 측도를 제안하고자 한다. 연관성 규칙 생성 시 신뢰도의 크기에 의해 규칙 생성 여부를 판단하게 되는데 신뢰도는 항목의 위치가 바뀌면 신뢰도의 크기가 달라지므로 두 값의 크기가 많은 차이가 나면 어느 것을 기준으로 연관성 규칙 생성 여부를 결정해야 할지 판단하기가 곤란하다(Park, 2016). 이러한 문제를 해결하기 위해 본 논문에서는 수정된 대칭적 J 측도를 제안하고자 한다. 또한 실제 사례와 모의실험 자료를 이용하여 J 측도와 관련된 기존의 측도들과의 비교를 통해 수정된 대칭적 J 측도의 유용성에 대해 탐색하고자 한다.

Today, with the development of information and communication technology and the spread of mobile devices, data has been exploding and big data environment has arrived (Park, 2017a). Various data mining techniques have been developed to analyze big data. Data mining is a technique to search for rules or information inherent in big data. There are various techniques such as neural networks, association rules, decision trees, and cluster analysis. In this paper, we propose a measure applying a J measure called cross entropy among the objective interest measures used in association rule mining. When the association rule is created, it is judged whether or not the association rule is generated by the size of confidence. When the position of the item is changed, the confidence degree is changed. Therefore, if the difference of two confidence values is large, it is difficult to judge which one to decide whether to generate association rules based on which one. To solve this problem, we propose a modified symmetric J measure. We also use examples to explore the usefulness of this measure through comparison with existing measures related to J measures.

1. 서론

2. 수정된 대칭적 J 측도의 제안

3. 적용 예제

4. 결론

로딩중