
유전자-유전자간 상호작용 분석을 위한 분류기법
Classification Methods For Analyzing Gene-Gene Interactions
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.13 No.2
- : KCI등재
- 2011.04
- 649 - 657 (9 pages)
인간 유전학에서 질병과 관련있는 DNA 염기순서의 변이를 확인하기 위해서 특정표현형과 단일 유전자좌간의 연관을 분석하는 방법들이 주로 사용되어왔다. 하지만 당뇨와 같은 복합질환에서는 유전자간의 상호작용이나 유전자와 환경인자간의 상호작용이 질병의 발생에 영향을 줄 수 있어서, 단일유전자좌의 분석으로는 설명할 수 없는 경우가 많이 발생한다. 유전자-유전자간 상호작용 및 유전자-환경인자간 상호작용을 분석하기 위한 여러 방법들이 제시되고 있다. 본 연구에서는 로지스틱 회귀분석을 비롯하여 의사결정나무, 신경망 분석, MDR 방법 등에 대해 알아보고, 유전자데이터에 이를 적용하여 분석하였다. 분석 결과 4개의 방법론 중 선형모형인 로지스틱 회귀분석은 의사결정나무보다는 오분류율이 약간 낮고, 비선형 모형인 신경망 분석과 MDR보다 높게 나타났다. 4개의 방법론의 결과가 동일하지는 않았으나, 질병과 관련된 주요 상호작용은 공통적으로 찾는 것을 확인하였다.
In the human genetics, single locus analysis method have been used primarily to find the associations between particular phenotype and disease-related mutations in the DNA sequencing. However, complex disease such as diabetes can be occurs by gene-gene interaction or gene- environment interaction, which can not be explained using single locus method. There have been various methods for analyzing gene-gene interaction or gene- environment interaction. In this study, we introduce logistic regression, decision tree, neural network and MDR methods and analyze genetic data applying four methods. The misclassification error of logistic regression was little lower than that of decision tree, and higher than that of neural network and MDR. All four methods candidate major interactions associated with disease, though they show slightly different results.
1. 서론
2. 분석방법
3. 자료 분석
4. 결론
참고문헌