찻잎의 FT-IR 스펙트럼과 UPLC 데이터로부터 다변량통계분석을 이용한 카테킨 함량 예측 PLS 모델링
PLS Prediction Modeling of Catechin Contents from FT-IR Spectral and UPLC Data of Tea Leaves using Multivariate Analysis
카테킨류는 epigallocatechin gallate (EGCG), epicatechin (EC), epigallocatechin (EGC), epicatechin gallate (ECG), catechin gallate (CG) 등 다양한 구조의 성분들이 있으며 특히, 차나무에 많이 함유되어 있다. 차나무 개체 및 품종별 찻잎의 카테킨 함량이 다르기 때문에 이러한 물질을 많이 가진 차나무를 신속하게 구별하는 것이필요하다. 본 연구에서 차나무는 한국, 중국, 일본, 인도의 유전자원 18종을 이용했으며 차나무 잎에서 추출한물질을 이용하여 카테킨류 함량을 분석하였다. UPLC 분석결과, 중국 유전자원 중 하나의 EGCG, GC와 ECG 함량이 높게 측정되었고 7가지 성분 중에서 EGC의 함량이 가장 높았지만 유전자원간의 편차가 가장 컸고 GC의함량이 가장 낮았지만 유전자원간의 편차가 적었다. FT-IR 스펙트럼은 1700∼1500 cm-1, 1500∼1300 cm-1 그리고 1100∼950 cm-1부위에서 패턴 변화차이를 보이고 있었고, PCA 분석결과는 PC 1과 PC 2 score 값이 전체 변이량의 각각 16.6%, 8.5%으로, 전체 변이량의 약 25.1%를 반영하고 있었다. 총 8종류의 카테킨류 중 주요한 성분인 EGCG, EC, EGC 그리고 ECG의 경우, 회귀분석한 결과 상관계수(R2 )가 각각 0.995, 0.996, 0.985 그리고 0.992 로 높은 예측율을 보였다. 이러한 연구를 통해 확립된 대사체 수준에서 차나무의 카테킨 함량 예측 모델링은 우수한 차나무 계통의 조기선발 수단으로서 활용이 가능하다고 생각된다.
Catechins, found especially in tea plants, have various structures such as epigallocatechin gallate (EGCG), epicatechin (EC), epigallocatechin (EGC), epicatechin gallate (ECG), and catechin gallate (CG). Since the catechin content of tea leaves is different for each individual and cultivars, it is necessary to quickly distinguish the tea plants having many of these substances. In this study, 18 tea germplasm from Korea, China, Japan and India were used and the catechin contents were analyzed using substances extracted from tea leaves. As a result of UPLC analysis, the EGCG, GC and ECG contents of one germplasm from China were measured to be the highest among all germplasm, and among the 7 components, the content of EGC was the highest, but also the deviation among germplasm was the highest. Besides, the content of the GC was the lowest, but also the deviation between germplasm was small. The FT-IR spectra showed a pattern change difference between 1700~1500 cm-1, 1500~1300 cm-1 and 1100~950 cm-1, and PCA analysis showed that PC 1 and PC 2 score values were 16.6% and 8.5% of the total variation, respectively. Therefore, about 25.1% of the total variation was reflected. In the case of EGCG, EC, EGC, and ECG, which are the major components of catechins, the regression analysis showed high correlation coefficients (R2 ) of 0.995, 0.996, 0.985, and 0.992 respectively. These results suggest that the predictive modeling of catechin contents of tea plants established at the metabolite level can be utilized as a means for the early selection of superior tea plants.
서 론
재료 및 방법
결과 및 고찰
참고문헌