상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
Journal of The Korean Data Analysis Society (JKDAS) Vol.25 No.1.jpg
KCI등재 학술저널

연속형 분포의 표본 분위수 계산 방법에 관한 고찰

A Study on Computing Sample Quantiles of Continuous Distributions

DOI : 10.37727/jkdas.2022.25.1.129
  • 20

표본 자료가 있을 때 이 자료의 분위수를 계산함으로써 모집단의 분위수를 추정한다. 통계학 교재에서 주로 소개하는 표본 분위수 계산 방법은 두 가지가 있다. 방법 1은 하나의 순서통계량 또는 인접한 두 순서통계량의 단순평균을 표본 분위수로 하는 방법이고, 방법 2는 인접한 두 순서통계량의 가중평균을 표본 분위수로 하는 방법이다. 본 논문에서는 몇 가지 연속형 분포의 경우에 이 두 방법을 모의실험을 통하여 비교하였다. 균일분포, 정규분포, 지수분포, 카이제곱분포, 베타분포의 경우에 대해 모수의 값을 몇 가지로 설정하고, 설정된 각각의 분포에 대해 크기 20, 30, 50인 확률표본을 추출하는 모의실험을 10,000회씩 실시하였다. 각 회의 모의실험에서는 방법 1과 방법 2 각각에 의하여 얻어진 표본 분위수와 모집단 분위수의 차이를 계산하였다. 두 방법을 비교하는 기준으로 두 가지를 사용하였는데, 한 가지는 10,000회의 모의실험에 걸친 평균제곱 오차이고, 다른 한 가지는 10,000회의 모의실험 중 모집단 분위수와의 차이가 상대 방법보다 더 작은 횟수이다. 모의실험 결과 두 번째 기준에서 방법 1이 우세한 경우가 월등히 많은 것으로 나타났다.

When sample data is given, we estimate the population quantiles by computing the quantiles of the data. In statistics textbooks there are two methods of computing sample quantiles. Method 1 uses a single order statistic or a simple mean of two adjacent order statistics as a sample quantile, and method 2 uses a weighted mean of two adjacent order statistics as a sample quantile. In this paper, we compared these two methods for the case of several continuous distributions by simulation. We considered some cases of uniform, normal, exponential, chi-square, and beta distributions, and for each distribution we performed 10,000 times of simulation of drawing a random sample of sizes 20, 30 and 50. In each time of simulation, we computed the difference between the population quantile and the sample quantile obtained by each method. We compared the two methods by two criteria: one is the mean square error over 10,000 times of simulation, and the other is the frequency of giving smaller difference from the population quantile than the competing method. As a result of simulation, method 1 turned out to be much more frequently superior to method 2 by criterion 2.

1. 서론

2. 표본 분위수를 계산하는 두 가지 방법

3. 이론적 고찰

4. 모의실험을 통한 비교

5. 결론

References

로딩중