상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
Journal of The Korean Data Analysis Society (JKDAS) Vol.25 No.5.jpg
KCI등재 학술저널

전자의무기록 데이터와 머신러닝 기법을 활용한 중환자실 사망 예측모델 개발

Development of mortality prediction model using electronic health record (EHR) data and machine learning algorithm in intensive care unit (ICU)

DOI : 10.37727/jkdas.2023.25.5.1977
  • 60

본 연구에서는 전자의무기록(Electronic Health Record, EHR) 데이터와 머신러닝(machine learning) 알고리즘 중 XGBoost(eXtreme Gradient Boosting)를 이용하여 사망예측 모델을 개발하고 평가하였다. 연구자료는 2017년 1월 1일부터 2020년 2월 29일에 1개 3차 의료기관의 내과, 외과중환자실에 입실한 환자 중 5211명(사망군: 685명, 생존군: 4526명)의 전자의무기록이다. 모델 개발 시 사용된 변수는 접근성이 높은 신체사정 기록, 신체사정 기록과 혈액검사, 앞서 언급된 변수와 그 외 다양한 변수로 구분하고 변수 중요도(feature importance)에 따라 각각 14개의 변수를 선정하여 모델을 개발하였다. 연구 결과, 호흡양상, 맥박, RASS(Richmond Agitation Sedation Scale), 수술 후 입실 여부가 다른 변수에 비해 상대적으로 높은 중요도를 보였다. 개발된 모델은 APACHE II, Random Forest 모델, 로지스틱 회귀 모델보다 높은 예측력을 보였다. AUC(Area Under Curve) 측면에서 .93 ~ .98 정도, 정확도 측면에서 0.91 ~ 0.95 정도의 우수한 성능이 관측되었다. 다양한 변수를 활용한 모델이 가장 예측력이 높았고 접근성이 좋은 신체사정 기록만을 활용한 모델도 충분한 예측력을 보였다. 본 연구를 통해 간호사가 환자를 직접 관찰하여 기록하는 정보가 사망예측 시 갖는 중요성과 접근성이 높고 간소화된 변수를 머신러닝 기법과 활용해 효율적인 사망예측을 할 수 있음을 확인할 수 있었다. 향후 의료진은 사망예측에 의한 기록 업무 부담을 줄이고 환자에 관한 정확한 정보를 제공받을 수 있을 것으로 기대된다.

In this study, a mortality prediction model was developed and evaluated using Electronic Health Record (EHR) data and the XGBoost (eXtreme Gradient Boosting) machine learning algorithm. The research dataset comprises EHR records of a total of 5,211 patients who were admitted to the medicine and surgery intensive care units of a tertiary medical institution from January 1, 2017, to February 29, 2020. Models were developed based on the accessibility of variable data, their high correlation with mortality, and their diversity. The research results indicated that variables such as respiratory pattern, pulse rate, RASS (Richmond Agitation-Sedation Scale), and post-surgery admission status showed relatively high importance compared to other variables. Models demonstrated higher predictive power compared to APACHE II, Random Forest and logistic regression models (AUC .93 ~ .98, accuracy .91 ~ .95). The model utilizing various variables showed the highest predictive power, but even a model based solely on accessible physical examination records demonstrated sufficient predictive capability. It was confirmed that patient observations recorded by nurses holds high importance and accessibility in mortality prediction. Also using simplified variables with machine learning techniques can efficiently predict mortality. It is expected that healthcare professionals can reduce the burden of record-keeping for mortality prediction and receive more accurate information about patients.

1. 서론

2. 연구방법

3. 연구결과

4. 논의

5. 결론 및 제언

References

로딩중