상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
한국국어교육학회_새국어교육.jpg
KCI등재 학술저널

한국어학 전공 외국인 대학원생을 위한 교육용 어휘 선정

Selection of Educational Vocabulary in Korean Linguistics Using Machine Learning: To Foreign Graduate Students Majoring in Korean Linguistics

DOI : 10.15734/koed..127.202106.491
  • 28

본 연구는 학문 목적 한국어교육을 위한 교육 내용 개발의 일환으로서 국어학 분야를 전공하는 외국인 대학원생을 위해 교육용 어휘를 선정하는 데 목적이 있다. 어휘 선정은 주요 내용어라고 볼 수 있는 명사, 동사, 형용사로 한정하였다. 이를 위해서 해당 학문 분야의 학술 텍스트로 대규모 말뭉치를 구축하였고 머신러닝 기법 중 하나인 텍스트랭크 알고리즘을 활용하여 어휘 목록을 구축하였다. 그 결과 290개의 명사와 182개의 용언을 합하여 모두 472개의 교육용 어휘가 선정되었다. 이 연구는 최근 문서 요약을 위한 핵심 키워드 추출에 많이 사용되며 그 결과의 타당성이 폭넓게 인정되어 온 머신러닝 알고리즘을 사용하여 교육용 어휘를 선정하는 새로운 방법을 제시했다는 점에서 차별성을 갖는다. 본 연구에서는 한국어학 분야에 우선적으로 이러한 방법론을 적용하여 보았지만 향후 모든 학문 분야에서 동일한 방법론을 적용하여 이제까지보다 더 대규모 말뭉치에서 더 객관적인 방법으로 더 타당한 어휘 목록을 산출할 수 있으리라 기대할 수 있다.

Purpose : This study aims to select educational vocabulary for foreign graduate students majoring in Korean linguistics as part of the development of educational content for Korean language education for academic purposes. Vocabulary selection was limited to nouns, verbs, and adjectives that could be considered the main content words. To this end, a large corpus was constructed with academic texts in the field of study and a vocabulary list was constructed using a TextRank algorithm, one of the machine learning techniques. As a result, a total of 472 educational vocabulary were selected, including 290 nouns and 182 verbs and adjectives. This work is differentiated in that it uses machine learning algorithms, which have widely recognized the validity of the results, to select educational vocabulary. Although this methodology has been applied first to the field of Korean linguistics, it can be expected that the same methodology will be applied in all academic fields in the future to produce a more relevant vocabulary list in a more objective way than ever in a larger corpus.

1. 서론

2. 연구 방법

3. 어휘 선정 결과

4. 논의

참고문헌

로딩중