상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
국립공원연구지 제14권 제1호.jpg
KCI등재후보 학술저널

국립공원에 서식하는 생물종의 분포모델 평가

남색이마잠자리(곤충강: 잠자리목)를 중심으로

본 연구는 기후변화 지표종 중 하나이고, 남방계열 생물종인 남색이마잠자리(Brachydiplax chalybea flavovittata Ris, 1911 (Insecta: Odonata), 이하 B. chalybea flavovittata)를 대상으로 생물종의 보전과 관리를 위한 유용한 정보를 제공하고, 보다 정확하고 연구목적에 최적인 분포모델을 개발하기 위해서 가장 기본적인 입력데이터와 환경변수가 분포모델에 영향을 미치는 2가지 요인을 평가하고자 한다. 특정지역으로 편중된 위치데이터와 환경변수인 생물기후변수의 다중공선성에 따른 모델의 예측정확도를 비교하였다. 이를 위해서 사용된 남색이 마잠자리의 서식 확인된 위치데이터는 GBIF 데이터베이스에서 수집하고 19개 생물기후변수는 Worldclim 데이터베이스에서 수집하였다. 위치데이터의 편중성은 위치데이터 상호간 일정한 거리를 두고 선택한 4가지 종류의 데이터를 이용하고, 환경변수의 다중공선성은 분산팽창계수(Variation Inflation Factor, VIF)를 이용하여 다중공선성 여부를 처리하였다. 7개 분포모델에 전처리된 데이터를 적용하고 3가지 평가지표(Kappa, TSS, AUC)로 모델의 예측정확도를 비교하여 분석하였다. 7개 분포모델은 비교를 위해서 기계학습과 회귀모델 기법 중에서 선택하였다. 기계학습 모델은 부트스 회귀 트리(Boosted Regression Trees, BRT), 랜덤 포레스트(Random Forest, RF) 및 서포트 벡터머신(Support Vector Machine, SVM), 분류 및 회귀 트리(Classification And Regression Trees, CART), MaxEnt이고, 회귀모델은 일반화 선형모델(Generalized Linear Model, GLM), 다변량 적응형 회귀 스플라인(Multivariate Adaptive Regression Splines, MARS)이다. 전반적으로 모델의 예측정확도는 비선형관계 등 생물종과 환경변수의 복잡한 상호관계를 더 잘 설명하는 기계학습 방법의 랜덤포레스트(RF) 모델이 다른 모델에 비해 상대적으로 우수하였다. 일반적으로 접근하기 쉬운 지역으로 조사되는 생물종 위치데이터의 편중성은 모든 모델에서 예측정확도에 영향을 주고 다중공선성은 모델에 따라 다양하였다. 본 연구는 생물종의 보전을 위한 연구목적에 부합하는 최적의 생물종 분포모델을 개발하는데 고려해야 할 기본지침을 국립공원 야생동물의 서식지를 효과적으로 관리하는데 필요한 기초자료로 활용하리라 기대된다.

This study aims to provide useful information for the conservation and management of Brachydiplax chalybea flavovittata (Ris, 1911) (Insecta: Odonata), which is a climate-sensitive biological indicator species, and to develop a more accurate and optimal distribution model that aligns with the research objectives. To achieve this, we intend to evaluate two factors that influence the prediction accuracy of the distribution model. In order to compare the prediction accuracy of the models based on biased location data in a specific region and based on the multicollinearity of environmental variables known as bioclimatic variables, the confirmed habitat locations of B. chalybea flavovittata were collected from the GBIF database, and 19 biological climate variables used as environmental variables were collected from the Worldclim database. The bias of the location data was examined using four types of data selected with a certain distance between the location data. The multicollinearity of the environmental variables was assessed using the Variation Inflation Factor (VIF). Preprocessed data were applied to seven species distribution models, and the prediction accuracy of the models was compared and analyzed using three evaluation metrics (Kappa, TSS, AUC). Among machine learning and regression models, seven distribution models were used for comparison. The machine learning models included Boosted Regression Trees (BRT), Random Forest (RF), Support Vector Machine (SVM), Classification and Regression Trees (CART), and MaxEnt, while the regression models included Generalized Linear Models (GLM) and Multivariate Adaptive Regression Splines (MARS). Overall, the prediction accuracy of the models was better explained by the Random Forest (RF) model, which is a machine learning method that better captures the complex relationship between species and environmental variables, compared to other models. The bias of location data, which is more commonly surveyed in easily accessible areas, affected the prediction accuracy in all models, while multicollinearity varied depending on the model. This study is expected to serve as fundamental guidance for developing an optimal species distribution model that aligns with the research objectives of species conservation and it can be utilized as foundational data for effective management of wildlife habitat in national parks.

서론

재료 및 방법

결과 및 고찰

참고문헌

로딩중