본고는 북경대학교 구문분석기 Cparser를 예시로, 기계의 문장 구조 이해와 의미 처리에 필수적인 요소인 구문 분석(句法分析, parsing)의 과정과 원리를 집중 조명한다. 먼저, 중국어 문장의 단어 경계 분석, 품사 태깅 및 구문 분석 등 일련의 기계 분석 절차와 Cparser의 사용 방법을 시각적으로 명시한다. 이어서, 구문분석기의 작동 원리에 대한 이해를 돕기 위해, 언어학적 이론 지식이 어떻게 Cparser의 어휘부, 통사부, 의미부에 체현되고 이들의 유기적 상호작용을 통해 자동 구문 분석을 실현하는지 구체적 예시와 함께 상세히 설명한다. 또한 실천적 예시로서, Cparser를 활용한 중국어 교재 트리뱅크를 시범적으로 구축한다. 본고의 이론적, 실천적 논의에 따라, 언어학 지식의 반영과 수정이 용이한 북경대학 구문분석기는 중국어 문법 연구에 유용한 분석 및 검증 도구로서 폭넓게 활용될 수 있을 것으로 기대된다.
This paper focuses on the process and principle of parsing, which is an essential task for machine to understand the syntactic, semantic structure of a sentence. First, a series of machine analysis procedures such as word segmentation, part-of-speech tagging and parsing of Chinese sentences are visually represented by using Cparser, a rule-based constituency parser developed by Peking University. Next, to better understand parsing mechanism, we explain in detail how the linguistic knowledge is embodied in the lexical, syntactic and semantic component of Cparser, showing their complex interplay that allows automatic parsing. As a practical example, a Chinese textbook treebank is also constructed using Cparser. According to the theoretical and practical discussion in this paper, Peking University Cparser, which is easy to reflect and modify linguistic knowledge, is expected to be widely used as an analysis and verification tool for Chinese grammar research.
1. 서론
2. 구문분석과 구문분석기
3. Cparser의 주요 기능
4. Cparser의 작동 원리
5. Cparser의 응용 사례
6. 결론
(0)
(0)