
정규모집단의 점추정에서 다섯수치요약의 상대효율에 관한 연구
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.24 No.4
- : KCI등재
- 2022.08
- 1225 - 1239 (15 pages)
통계적 추론에서 주어진 통계 정보의 가치는 일반적으로 분산 및 표본크기와 큰 관련이 있다. 분산이 작은 정보, 표본크기가 큰 정보가 가치가 높다. 통상 수리통계학에서는 정보의 가치를‘피셔 정보량’으로 측정한다. 그러나 이는 로그우도함수의 1차 도함수인 score-통계량의 제곱의기댓값으로 정의되는데 이를 수리적으로 명확히 계산해낼 수 있는 경우는 많지 않다. 이러한 이유로 이의 관측값인 ‘관측된 피셔 정보량’을 대안으로 사용한다. 본 연구에서는 정규모집단 관련통계적 추론에서 주어진 정보가 표본크기와 함께 다섯수치요약 즉 {최소값, 제1사분위수, 중위수, 제3사분위수, 최대값}의 일부 또는 전부일 때 그 주어진 정보의 가치를 ‘관측된 피셔 정보량’ 에 근거하여 측정하고 충분통계량의 정보 가치와 비교하였다. 그리고 정보가 추가될 때 추가되는 정보의 가치도 평가해 보았다. 이를 위한 방법으로 우선 관측된 피셔 정보량 계산식을 도출하였으며, 이를 R에서 구현하는 함수도 작성하였다. 이를 바탕으로 R에서 컴퓨터 모의실험을 실시하였다. 얻어진 많은 결과들 중 모평균을 추정할 때 표본크기가 아주 작은 경우가 아닌 한 최대값과 최소값 정보는 그 가치가 아주 미약하며, 다섯수치요약 정보는 충분통계량 대비 상대효율이 거의 86.5%정도 이었다. 모표준편차를 추정하는 경우 중위수는 최대값과 최소값 정보에 추가될 때와 제1사분위수와 제3사분위수에 추가될 때는 어느 정도 유용한 정보로 작용하지만 이들이 모두 있는 경우에 추가될 때는 도리어 정보 가치를 훼손하는 것으로 나타났다. 이러한 현상들은 모평균과 모표준편차를 동시에 추정하는 경우에서도 비슷하게 나타났다.