연관성 평가를 위한 상대적 기대 조건부 엔트로피의 활용
Application of a Relatively Expected Conditional Entropy for Association Rule Assessment
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.20 No.1
- : KCI등재
- 2018.02
- 217 - 226 (10 pages)
산업혁명은 성장의 정체를 기술 혁신을 통해 극복하고 경제·사회에 대한 혁신적 변화를 나타내는 것으로 그동안 기계혁명인 1차 산업혁명, 생산혁명인 2차 산업혁명, 지식서비스 산업의 기반을 조성한 제 3차 산업혁명, 그리고 빅 데이터와 함께 다양한 정보 통신 기술의 발전과 융합으로 나타난 4차 산업혁명이 그것이다(Bok, Yoo, 2017). 빅 데이터 기술 중의 하나인 데이터 마이닝은 빅 데이터로부터 쉽게 드러나지 않는 유용한 정보를 이용하여 조직의 의사 결정을 위한 근거로 활용하고자 하는 것이다(Park, 2014). 본 논문에서는 기본적인 연관성 평가 기준 중에서 신뢰도와 엔트로피 기반 신뢰도를 대체할 수 있는 상대적 기대 조건부 엔트로피를 제안하였다. 그 결과, 신뢰도는 항상 양의 값만을 취하기 때문에 연관성의 방향을 나타낼 수 없는 반면에 엔트로피 기반 신뢰도와 상대적 기대 조건부 엔트로피는 양 또는 음의 값을 가지므로 연관성의 방향을 파악할 수 있다는 사실을 확인하였다. 또한 엔트로피 기반 신뢰도와 상대적 기대 조건부 엔트로피 중에서는 후자가 전자보다 더 큰 값을 가질 뿐만 아니라 값이 변화하는 간격이 좀 더 크게 나타났다. 따라서 이들 세 가지 측도 중에서는 상대적 기대 조건부 엔트로피가 연관성 평가 기준으로 가장 바람직하다고 사료된다.
The industrial revolution overcomes technological innovation through technological innovation and represents a revolutionary change in the economy and society. Looking back at the industrial revolution that has occurred in the past, the first industrial revolution was the machine revolution, the second industrial revolution was the product revolution, the third industrial revolution was the basis of the knowledge service industry, and the fourth industrial revolution emerged with the development and convergence of various information and communication technologies along with big data. Data mining, one of the big data technologies, aims to utilize useful information that is not easily exposed from big data as a basis for the decision making of the organization. In this paper, we proposed a relatively expected conditional entropy that can replace confidence and entropy based confidence. Among these three measures, we found that the relatively expected conditional entropy was the most desirable measure as association threshold.
1. 서론
2. 상대적 기대 조건부 엔트로피
3. 모의실험에 의한 비교
4. 결론
References