상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
153077.jpg
KCI등재 학술저널

척도화 향상도를 고려한 연관성 규칙 수의 회귀모형 구축

Regression Modeling by Scaled Lift for Association Rule Number Estimation

  • 2

본 논문에서는 연관성 규칙의 수를 추정하기 위해 척도화 향상도를 고려한 회귀 모형을 제안한 후, 기존의 회귀 모형과의 비교를 통해 그 유용성을 살펴보고자 한다. 이를 위해 각 모형에 대한 회귀계수를 추정하고, 분산분석 결과와 수정 결정계수를 이용하여 각 모형의 적합도와 기여도를 비교하였으며, 이들을 토대로 가장 바람직한 회귀 모형을 구하였다. 결과들을 종합해볼 때, 신뢰도와 함께 비선형 회귀 모형을 적합시키는 경우에는 기본적인 향상도를 고려하는 것이 바람직하며, 지지도와 함께 모형을 적합시키는 경우에는 척도화 향상도를 고려하는 것이 바람직한 것으로 나타났다. 또한 유의한 회귀 계수의 수가 모든 유형에서 척도화 향상도를 적용한 모형에서 더 많이 나타났다. 이로부터 기본적인 연관성 평가 기준을 사용하여 회귀모형을 구축할 때 보다 척도화 향상도를 고려하여 모형을 구축하게 되면 더 많은 평가 기준에 의해 연관성 규칙의 수를 설명할 수 있는 것으로 해석할 수 있다. 따라서 연관성 평가 기준에 의해 연관성 규칙의 수를 추정하고자 하는 경우에는 기본적인 향상도나 표준화 향상도보다 척도화 향상도를 적용한 비선형 회귀 모형이 더 바람직하다고 할 수 있다.

In this paper, we proposed some non-linear regression equations for the number of rules and thresholds of support, confidence, and scaled lift. Furthermore we explored for their usefulness as compared to conventional regression models using regression coefficients, analysis of variance, and adjusted coefficients of determination. After all the analysis, we found that the non-linear regression equations by confidence and lift were the most desirable models, and the equations by support and scaled lift were the most likeable models. In all types, the numbers of significant regression coefficients of the models by scaled lift were larger than those of the models with basic lift. It means that the models by scaled lift can describe the number of association rules by more thresholds. So, if we estimate the number of association rules by the association criteria, the non-linear regression model with scaled lift is more desirable than those of basic lift and standardized lift.

1. 서론

2. 척도화 향상도에 의한 비선형 회귀 모형

3. 적용 예제

4. 결론

References

로딩중