본 연구는 다변량 데이터셋 내에서 특정 관측치의 이상 징후를 감지하기 위해 데이터 마이닝과 관리도의 원리를 통합하는 새로운 알고리즘에 기반한 방법론을 제시한다. 최근 k-최근접 이웃(kNN) 패러다임을 기반으로 한 이상치 점수 계산 방법에 대한 연구가 활발히 이루어지고 있다. 그러나 kNN 알고리즘의 내재된 계산복잡성으로 인해 대규모 데이터셋에 적용하는 데 그 실용적 한계가 있다. 본 연구의 주된 목적은 격자(grid) 기반의 kNN 알고리즘을 활용하여 k개의 최근접 이웃 관측치을 식별하는 데 필요한 계산 노력을 감소시키는새로운 관리도 체계를 제안하는 것이다. 본 연구에서 제안된 방법론의 효과를 검증하기 위해 다양한 실험 환경에서 광범위한 실험을 수행하였다. 이 실험들로부터 도출된 경험적 결과는 제안된 방법이 분석에 필요한 계산 시간을 상당히 줄이면서도 이상 탐지와 관리도 작성의 맥락에서 예측 가능하고 수용 가능한 정밀도와 신뢰성을 유지한다는 점에서 그 효율성 향상을 입증한다.
This paper presents an algorithmic approach that integrates data mining principles with control chart techniques to detect deviations from standard values within a multivariate dataset. Recently, research has focused on methods for calculating outlier scores based on the k-nearest neighbors (kNN) paradigm. However, the practical utility of kNN-based methods is limited due to the computational complexities inherent in the kNN algorithm, which restrict its applicability to large datasets. The main aim of this research is to propose a new control chart framework that utilizes a grid-based kNN algorithm to reduce the computational effort involved in identifying the k nearest neighbors. To validate the effectiveness of this methodological innovation, extensive experiments were conducted in various experimental settings. The empirical results from these experiments demonstrate significant efficiency gains, as the proposed method considerably reduces the computation time required for analysis while maintaining a level of precision and reliability that is both predictable and acceptable in the context of anomaly detection and control charting.
Ⅰ. Introduction
Ⅱ. Literature Review
Ⅲ. Proposed Method: Grid-based kNN Control Chart
Ⅳ. Simulation Study
Ⅴ. A Real-Life Data Example
Ⅵ. Conclusions
References
(0)
(0)