상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
학술저널

인공지능 기반 단백질-리간드 상호작용 예측을 위한 신약 후보 물질 발굴 프레임 워크

AI-Driven Prediction of Protein-Ligand Interactions for Accelerated Drug Discover

  • 6
산업기술연구논문지 제30권 3호.jpg

본 연구는 단백질–리간드 상호작용 예측에서 구조 기반 접근의 한계를 극복하고자, 단백질 서열 기반의 입력만으로도 예측이 가능한 경량 인공지능 기반 결합 친화도 예측 프레임워크를 제안한다. 리간드는 BindingDB에서 수집한 12,309개의 SMILES 데이터를 2048차원의 Morgan Fingerprint로 인코딩하고, 단백질은 AAC(20차원)으로 표현하였다. 입력값으로 XGBoost 회귀모델을 구성하고, 예측값과 실제값의 차이를 보정하는 2단계 회귀모델을 구현하였다. 최종 예측값은 RMSE 0.90, 결정계수(R²) 0.74, 정확도 88%, AUC 0.948의 성능을 보였으며, SHAP 해석을 통해 주요 아미노산 조성과 서브스트럭처가 예측에 영향을 미침을 확인했다. 본 프레임워크는 약물 재창출 및 가상 스크리닝에서 구조 기반 모델을 보완하는 도구로 활용할 수 있다.

This study proposes a lightweight artificial intelligence-based prediction framework to address the limitations of structure-based methods for predicting protein-ligand interactions. Unlike conventional approaches, the model relies exclusively on sequence-based inputs. A total of 12,309 ligand molecules were retrieved from BindingDB and encoded as 2,048-dimensional Morgan fingerprints derived from SMILES notation. Protein sequences were represented as 20-dimensional amino acid composition (AAC) vectors. These embeddings were used as inputs to an XGBoost regression model to predict binding affinity (pKi), followed by a second-stage regression model that calibrated predictions based on residual errors. The final calibrated framework achieved strong predictive performance, with an RMSE of 0.90, R² of 0.74, a binary classification accuracy of 88%, and an AUC of 0.948. Furthermore, shapley additive explanations (SHAP) highlighted the contributions of specific amino acid features —such as tryptophan (AAC_W) and histidine (AAC_H)—as well as ligand substructures, to the predicted binding affinity. By enabling rapid and accurate predictions without requiring 3D protein structures, this framework provides a versatile complement to structure-based methods and offers practical utility for applications such as drug repurposing and virtual screening.

Ⅰ. 서 론

Ⅱ. 연구 방법

Ⅲ. 실험 결과 및 분석

Ⅳ. 논 의

Ⅴ. 결 론

ACKNOWLEDGEMENTS

References

(0)

(0)

로딩중