
십분위분배율을 이용한 정규성 검정
Goodness-of-fit Test for Normality Based on Decile Dispersion Ratio
- 이경준(Kyeongjun Lee) 박찬근(Chankeun Park)
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.22 No.3
- 등재여부 : KCI등재
- 2020.06
- 1023 - 1032 (10 pages)
데이터의 통계적 분석에서 우선 주어진 데이터가 어떤 통계적 분포를 따르는지에 관한 검정은 통계학에서 매우 중요한 과제 중 하나이다. 적합도를 검정하는 방법은 크게 두 가지로 나눌 수 있고, 그 중 하나는 히스토그램, P-P 플롯, Q-Q 플롯과 같은 그래프를 활용한 방법이다. 하지만 이러한 방법은 직관적이긴 하지만 객관적이진 않다. 또 다른 방법은 검정 통계량을 이용하는 방법이다. 따라서 본 논문에서는 십분위분배율(decile dispersion ratio)을 이용한 정규성 검정을 위한 적합도 검정 통계량을 제안하였다. 몬테카를로 모의실험을 통하여 십분위분배율을 이용한 새로운 정규성 검정 통계량과 전통적 방법에 의한 검정 통계량의 검정력을 비교하여 더 우수한 적합도 검정 통계량을 확인하고자 한다. 그 결과 좌우 비대칭 형태의 분포의 경우 새롭게 제안한 검정 통계량이 대부분 우수하게 나타났고, 좌우 대칭 형태의 분포에서는 t 분포에서 새롭게 제안한 검정 통계량이 우수한 결과가 나타났다. 또한, 호지킨 질병 자료를 활용하여 정규성 적합도 검정을 실시하였다. 그 결과 원 자료의 경우 정규분포를 따르지 않았지만 이를 자연로그변환한 자료의 경우 정규분포를 따르는 것을 확인할 수 있었다.
Since the normality is one of the most important assumption in statistical analysis, the normality test has been studied by many authors. The methods for the normality test can be divided into two groups. The first group is based on statistical graphics. For examples, there are histogram, Q-Q plot, and P-P plot. These graphical methods are more intuitively appealing but not objective. The second one is based on test statistics. Therefore, in this paper, we proposed the goodness-of-fit test for normality(called the DR test) based on decile dispersion ratio. Monte Carlo simulation is performed for various distributions and several sample sizes, in order to find the efficiency of proposed method and to compare with the powers of Shapiro-Wilks test, Anderson-Darling test, Cramer-von Mises test, Kolmogorov-Smirnov test and GLC test. In addition, Hodgkin disease data have been analyzed. As a result, in asymmetric distributions and t distribution, the proposed test statistic using decile dispersion ratio is more powerful than other test statistics.
1. 서론
2. 새로운 정규성 검정 통계량
3. 모의실험
4. 결론
References