상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
학술저널

이중 언어 말뭉치 구축에 대한 제안 - 한중 말뭉치를 중심으로

A Suggestion for Building Bilingual Corpus

  • 0
한국중국언어학회.png

말뭉치 언어학(Corpus Linguistics)은 '실제 언어' 혹은 실제 언어의 샘플을 이용하여 언어를 공부하는 응용언어학의 한 분야이다. 세종 프로젝트의 한영/한일 말뭉치는 형태분석과 구문분석에 대한 정보가 내포되어 있는 주석 말뭉치이다. 주석 말뭉치는 언어학자들의 분석이 첨부되어 있기에 보다 정확한 정보를 이용자에게 제공한다는 장점이 있지만 상응하는 단점 또한 존재한다. 본고는 이미 구축되어 있는 말뭉치의 장점과 단점을 분석하고 새로운 이중 언어 말뭉치 모델을 제시해 보도록 한다.

Corpus linguistics is a field of applied linguistics devoted to the study of languages ​​using 'real language' or actual language samples. The Sejong Project's Korean-English/Korean-Japanese corpus is an annotated corpus with information on morphological analysis and parsing. The annotated corpus has the advantage of providing users with more accurate information thanks to the linguists' analysis attached, but there are corresponding disadvantages as well. This paper is aimed at analyzing the advantages and disadvantages of the corpus that have been already built in, and at suggesting a new bilingual corpus model.

1. 이중 언어 말뭉치의 구축 필요성

2. 한중 말뭉치 구축

3. 저작권 해결 방법

4. 맺는말

(0)

(0)

로딩중