상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
국가지식-학술정보

대량의 프로테옴 데이타를 효과적으로 해석하기 위한 기계학습 기반 시스템

An Effective Data Analysis System for Improving Throughput of Shotgun Proteomic Data based on Machine Learning

  • 0
커버이미지 없음

최근 프로테오믹스 분야에서 단백질의 추출, 분리기술의 발전과 고성능 질량분석 장비로 인하여 대량으로, 또 빠르게 샘플을 분석하는 것이 가능해짐에 따라서, 한번의 실험으로부터 얻어지는 실험데이타의 양이 대폭 늘어나게 되었다. 따라서 대량의 데이타를 어떻게 처리하여 필요한 정보만을 얻어내는가가 큰 이슈가 되고 있다. 하지만 기존의 데이타 해석과정은 불필요하게 계산자원을 낭비하는 요소를 상당 부분을 포함하고 있고, 이로 인해 데이타 해석 시간이 증가함은 물론, 종종 옳지 않은 해석 결과를 생성함으로써 결과에 대한 신뢰도의 저하를 초래했다. 본 논문에서는 기존의 데이타 해석 과정에서의 문제점을 지적하고, 데이타 처리의 효율을 높임과 동시에 해석 결과의 신뢰도를 제고하기 위한 SIFTER 시스템을 제안한다. SIFTER 시스템은 본격적인 데이타 해석에 앞서, 질량 스펙트럼의 질을 평가하고 하전량을 결정하는 소프트웨어를 제공한다. 탠덤 질량 스펙트럼에 나타나는 단편 이온의 특성을 고려하여 스펙트럼의 질과 하전량을 정확하게 결정하는 방법을 제공함으로써, 데이타 해석에 앞서 스펙트럼의 질이 낮아 해석이 불가능할 것이 분명한 경우 이들을 미리 제거하고 스펙트럼 해석과정에 잘못된 정보가 사용되지 않도록 한다. 결과적으로 데이타 해석과정에서의 효율과 해석결과의 정확성에 있어 대폭적인 개선을 기대할 수 있다.

In proteomics, recent advancements In mass spectrometry technology and in protein extraction and separation technology made high-throughput analysis possible. This leads to thousands to hundreds of thousands of MS/MS spectra per single LC-MS/MS experiment. Such a large amount of data creates significant computational challenges and therefore effective data analysis methods that make efficient use of computational resources and, at the same time, provide more peptide identifications are in great need. Here, SIFTER system is designed to avoid inefficient processing of shotgun proteomic data. SIFTER provides software tools that can improve throughput of mass spectrometry-based peptide identification by filtering out poor-quality tandem mass spectra and estimating a Peptide charge state prior to applying analysis algorithms. SIFTER tools characterize and assess spectral features and thus significantly reduce the computation time and false positive rates by localizing spectra that lead to wrong identification prior to full-blown analysis. SIFTER enables fast and in-depth interpretation of tandem mass spectra.

(0)

(0)

로딩중