상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
몽골학 제73호.jpg
KCI등재 학술저널

몽골어의 사용역별 어휘 다양성 비교 연구

본 연구의 목적은 몽골어가 사용역별로 어휘 다양성에서 어떠한 특징을 보이는지를 수량적으로 비교 분석해 보는 것이다. 이를 위해 먼저 몽골어의 사용역별로 90,605 Token 크기로 10개의 코퍼스를 구축하였으며 각각의 코퍼스별로 어휘 다양성을 측정할 수 있는 여러 지표들의 값을 구하여 비교하였다. 그 결과 어휘 다양성이 가장 큰 영역은 문학 교과서였으며 그 다음으로 신문 기사(문화), 신문 기사(국제), 인터뷰, 신문 기사(스포츠), 신문 기사(사회), 신문 기사(경제), 팟캐스트, 신문 기사(정치), 법률 순이었다. 즉, 몽골어에서는 문학 교과서와 신문 기사의 문화면, 국제면 등의 사용역에서 가장 많은 어휘가 사용되고 있으며 법률, 신문 기사의 정치면, 즉흥적 대화(팟캐스트) 등의 사용역에서 가장 적은 어휘가 사용된다는 것을 수량적으로 밝혔다. 또한 신문 기사를 6개 영역으로 나누어 분석하였는데 각 영역별로 어휘 다양성에서 큰 차이를 보였다. 이것은 코퍼스 구축이나 코퍼스 기반 연구를 할 때 신문 기사를 하나의 사용역으로 취급해서는 안 되고 반드시 영역별로 나누어 다루어야 한다는 것을 수량적으로 증명하는 결과이다. 또한 코퍼스별 Token 수가 동일하다면 대부분의 어휘 다양성 지표들이 모두 동일한 결과를 나타내지만 코퍼스의 규모가 다를 때는 지표들이 서로 다른 결과를 나타낸다는 것도 확인할 수 있었다. 마지막으로 어휘 다양성을 연구할 때 어느 한 지표만을 가지고 분석하는 것보다 가능한 한 많은 지표들의 값을 구하여 서로 비교 분석하는 것이 연구 결과의 오류를 줄일 수 있는 하나의 방법임도 증명하였다.

The purpose of this study is to compare and analyze quantitatively the characteristics of lexical diversity by each register of the Mongolian language. To this end, 10 sample corpuses were established with the size of 90,605 tokens for each of ten registers and lexical diversity was measured for each corpus. The values of lexical diversity indices were obtained and compared. As a result, the register with the largest lexical diversity was literature textbook, followed by newspaper articles (culture), newspaper articles (world), interviews, newspaper articles (sports), newspaper articles (society), newspaper articles (economy), podcasts, newspaper articles (politics), and law. In other words, in Mongolian language, the most vocabulary is used in literature textbooks and newspaper articles such as culture and world news, and the least vocabulary is used in law, politics in newspaper articles, and impromptu conversation (podcasts). In addition, newspaper articles were divided into six registers and analyzed, and each register showed a large difference in lexical diversity. This is a result that quantitatively proves that newspaper articles should not be treated as a single register when corpus composition or corpus-based research, but must be divided into registers. And, in the process of this study, it was confirmed that most of the lexical diversity indices show the same results if the number of tokens per corpus is the same, but the indices show different results when the size of the corpus is different. Finally, when studying lexical diversity, it is also proved that one way to reduce errors in research results is to obtain values of as many indices as possible and compare them with each other rather than analyzing with only one index.

1. 서론

2. 기본 용어의 정의

3. 어휘 다양성

4. 몽골어의 사용역별 코퍼스 구축

5. 몽골어의 사용역별 어휘 다양성에 대한 실증 분석 및 비교

6. 결론 및 논의

로딩중