이변량 준연속형 비율자료 분석을 위한 회귀모형
Regression Models for Bivariate Semi-continuous Proportion Data
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.19 No.2
- : KCI등재
- 2017.04
- 663 - 673 (11 pages)
본 연구에서는 특정 이산 값들이 관찰되는 이변량 연속형 반응자료의 회귀모형을 제안하였다. 제안모형은 최근에 들어서야 다변량 분포를 구축하기 위한 방법으로 관심 받고 있는 사르마노프 이변량 분포에 기초하여 특정 이산 값들의 확률값을 연속형 분포와 함께 모형화하기 위한 혼합물분포를 활용하였다. 특정범위의 연속형 값을 포함하고 있는 준연속형 반응변수의 경우 양 극단에서 특정 이산 값들이 발생하는 경우에 토빗모형을 사용하거나 이들 값들을 제거하여 분석에 활용하고 있다. 반면 본 연구에서 제안하는 모형은 비율형 자료 가운데 어느 값에서 이산값이 관찰되더라도 사용할 수 있는 유연성을 가지고 있으며 동시에 특정 이산값의 발생여부에 대한 통계적 추론을 가능하게 하여 이와 같은 자료를 가지고 분석하고자 하는 연구자들에게 유용한 정보를 제공할 수 있는데, 특히 상당한 연관성을 가지고 있는 다수의 반응변수들에 대한 분석을 가능하게 한다는 점에서 보다 다양한 현상들에 대한 분석결과를 제공할 수 있을 것이다. 실제 자료를 이용한 분석결과 기존의 이변량 토빗모형에 비해 모형의 적합도에서 우수한 것으로 나타났다.
In this study, we proposed a regression model of bivariate continuous response data in which certain discrete values are observed. The proposed model uses a distribution of mixtures to model the probability distribution of certain discrete values with a continuous distribution, using the Sarmanov bivariate distribution, which is currently being used as a method for constructing multivariate distributions. In the case of semi-continuous response variables containing a certain range of continuous values, the Tobit model is used when certain discrete values occur at both extremes, or these values are removed and used for analysis. In contrast, the proposed model has the flexibility to use discrete values from any of the ratios and also makes it possible to make statistical inferences about the occurrence of certain discrete values. It can provide useful information to researchers, particularly in the context of enabling analysis of a bivariate response variables with a great deal of relevance. As a result of the analysis using empirical data, it was found that the fit of the model was better than the conventional bivariate Tobit model.
1. 서론
2. 사르마노프 이변량 준연속형 베타회귀모형
3. 분석사례
4. 결론