상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
153040.jpg
KCI등재 학술저널

고객 구매정보의 데이터마이닝 성능 향상을 위한 수정절사추출법 응용

Application of Modified Cut-off Method to Improve the Performance of Data Mining on Customer Purchase Information

고객이 등록한 구매정보를 분석하기 위해 데이터마이닝을 이용하는데 표본추출방법은 분석의 첫 단계인 데이터마트 준비단계에서 활용된다. 방대한 고객데이터로부터의 표본추출은 랜덤추출, 층화추출 등을 활용하고 있고 일반적으로 분석솔루션의 능력에 적합하도록 표본크기를 조정하게 된다. 그러나 이러한 방법들은 추출한 표본이 모집단의 특성을 얼마나 잘 반영하는지 판단할 수 있는 신뢰수준 및 오차에 대한 정보가 결핍될 수 있다. 따라서 최소한의 사전분석을 통해 양질의 표본을 구성하는 것은 전체적으로 데이터마이닝 분석의 질을 향상시키는 매우 중요한 과정이 된다. 본 논문에서는 수정절사추출법(modified cut-off method)을 이용하여 표본을 추출하면 방대한 고객정보로부터 최소한의 표본크기로도 모집단의 특성을 잘 반영할 수 있다는 것을 입증하였다.

Sampling methods are used in the preparatory stage of the analysis of customers’ data. Mostly, the simple random sampling method or the stratified sampling method are used with the samples from the huge amount of customers’ data, the size of which is adjusted to comply with the analysis solution performance. However, these methods could lack the information about the confidence of limit and the bound of errors, which help estimate how much the samples can reflect the property of the population. It is very important for improving the analysis quality to gather good samples through minimized pre-analysis. This article shows that the modified cut-off method can be used to reflect very well the property of population just with the minimized samples from the huge customer’s data.

1. 서론

2. 수정절사추출법

3. 사례

4. 결론

참고문헌