
고객 구매정보의 데이터마이닝 성능 향상을 위한 수정절사추출법 응용
Application of Modified Cut-off Method to Improve the Performance of Data Mining on Customer Purchase Information
- 문승호(Sungho Moon)
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.12 No.1
- 등재여부 : KCI등재
- 2010.02
- 307 - 317 (11 pages)
고객이 등록한 구매정보를 분석하기 위해 데이터마이닝을 이용하는데 표본추출방법은 분석의 첫 단계인 데이터마트 준비단계에서 활용된다. 방대한 고객데이터로부터의 표본추출은 랜덤추출, 층화추출 등을 활용하고 있고 일반적으로 분석솔루션의 능력에 적합하도록 표본크기를 조정하게 된다. 그러나 이러한 방법들은 추출한 표본이 모집단의 특성을 얼마나 잘 반영하는지 판단할 수 있는 신뢰수준 및 오차에 대한 정보가 결핍될 수 있다. 따라서 최소한의 사전분석을 통해 양질의 표본을 구성하는 것은 전체적으로 데이터마이닝 분석의 질을 향상시키는 매우 중요한 과정이 된다. 본 논문에서는 수정절사추출법(modified cut-off method)을 이용하여 표본을 추출하면 방대한 고객정보로부터 최소한의 표본크기로도 모집단의 특성을 잘 반영할 수 있다는 것을 입증하였다.
Sampling methods are used in the preparatory stage of the analysis of customers’ data. Mostly, the simple random sampling method or the stratified sampling method are used with the samples from the huge amount of customers’ data, the size of which is adjusted to comply with the analysis solution performance. However, these methods could lack the information about the confidence of limit and the bound of errors, which help estimate how much the samples can reflect the property of the population. It is very important for improving the analysis quality to gather good samples through minimized pre-analysis. This article shows that the modified cut-off method can be used to reflect very well the property of population just with the minimized samples from the huge customer’s data.
1. 서론
2. 수정절사추출법
3. 사례
4. 결론
참고문헌