이항 반응변수에 대한 판별분석에서 표본크기 결정 방법들에 대한 비교와 사례 연구
A Comparison and Case Study on Sample Size Determination Methods in Discriminant Analysis with Binary Response Variables
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.20 No.5
- : KCI등재
- 2018.10
- 2285 - 2296 (12 pages)
의학, 약학, 간호학 등에서 판별모형 또는 진단 테스트의 정확성을 평가할 때, 표본크기는 추정이나 정확도의 평가를 위해 중요한 역할을 한다. 최근에는 사회과학의 여러 분야에서도 적절한 표본크기 계산에 대한 중요성이 강조되고 있다. 작은 표본크기는 넓은 신뢰구간을 가지는 부정확한 추정치를 생성하는 원인이 될 수 있다. 반면에, 과도하게 큰 표본크기는 자원을 낭비하게 만든다. 본 논문에서는 이항 반응변수 𝙔 (=1, 0)와 예측변수 𝙕 가 주어져 있는 경우를 고려하였으며, 정확도, 민감도, 특이도 등을 바탕으로 하는 다양한 표본크기 결정 방법들을 소개하였다. 또한 로지스틱 회귀분석을 위한 표본크기 결정 방법들도 제시하였다. 특히 본 논문에서는 기존에 제안된 개별 방법들을 통합적인 관점에서 비교하였으며, 보다 완성된 형식으로 수식들을 정리하였다. 또한 각 방법들을 적용하여 표본크기를 계산하는 사례를 제시하였다. 이와 같은 내용이 다양한 연구 분야에서 판별모형을 적용하고자 하는 많은 연구자들에게 큰 도움이 될 것으로 기대한다.
When assessing the accuracy of discriminant models or diagnostic tests in medicine, pharmacy, nursing, etc., sample size plays an important role in estimating or assessing accuracy. Recently, the importance of proper sample size calculation has been emphasized in various fields of social science. A small sample size can cause an inaccurate estimate with a wide confidence interval to be generated. On the other hand, excessively large sample sizes make resources wasted. In this paper, we considered the binomial response variables 𝙔 (=1, 0) and predictive variables 𝙕 , and introduced various sample size determination methods based on accuracy, sensitivity, and specificity. Sample sizes for logistic regression analysis are also presented. Especially, in this paper, the proposed methods are compared in terms of integration and the formulas are summarized in a more complete form. In addition, examples of calculating the sample size by applying each method is presented. This is expected to be of great help to many researchers who want to apply discriminant models in various research fields.
1. 서론
2. 로지스틱 회귀분석의 경우
3. 민감도와 특이도를 이용하는 방법
4. AUC를 이용하는 방법
5. 카파 계수를 이용하는 방법
6. 결론
References