기계 번역과 자연어처리를 활용한 튜터링 활동 분석
Analyses of tutoring activities via machine translation and NLP
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.25 No.1
- : KCI등재
- 2023.02
- 405 - 416 (12 pages)
본 연구는 Yoon, Kim, Choi, Kim(2021)의 후속 연구로서 본 연구에서는 이전 연구와 동일한 텍스트를 영문으로 기계 번역한 다음, 통계 모형을 통해 도출한 토픽과 이전 연구의 국문 텍스트로부터 도출된 범주를 비교하였다. 이를 통해 단순히 기계 번역의 질 만을 평가하기 보다는 텍스트에 적용한 자연어처리 모형 및 모형 적합 후 결과 해석 과정에서 인간 연구자의 역할, 인간 번역과 기계 번역의 조화에 관한 문제에 대해서도 함께 살펴보고자 하였다. 분석 대상인 텍스트는 D 대학의 교양교육튜터링 프로그램으로부터 수집되었으며, 토픽 모델링에 자주 사용되는 잠재디리클레할당 모형에 대한 이론적인 서술과 R ‘topicmodels’ 라이브러리 사용에 관한 설명을 부가하였다. 분석 결과 이전 연구와 다소 상이한 토픽이 도출되었고 이에 대한 연구진의 해석을 제시하였다. 자연어처리의 폭발적인 성장 추세와 자연어처리의 한 갈래로서 기계 번역은 거스를 수 없는 흐름임을 인정하면서도, 인간 번역자의 개입 여지를 함께 논의하였다. 본 연구는 교양교육연구에 있어 자연어 처리를 활용한 데이터 분석 기법과 기계번역 논의를 결합시킴으로써 교양교육연구에 새로운 접근법을 제시하고 있다.
This is a follow-up study by Yoon, Kim, Choi, and Kim (2021). In the current study, the same text as the previous study was machine-translated into English, and then the topics derived through a statistical model, which were compared with the categories derived from the Korean text of the previous study. By doing this, rather than simply evaluating the quality of machine translation, the present study examined 1) the natural language processing model applied to text, 2) the role of human researchers in the process of interpreting the results after fitting the model, and 3) the harmony between human and machine translation, The texts to be analyzed were collected from the liberal arts education tutoring program of D university. A theoretical description of the Latent Dirichlet Allocation model, which is often used for topic modeling, and an explanation of the use of the R library ‘topicmodels’ were added. The analyses revealed a somewhat different pattern of topics from the previous study, and the authors’ interpretation was presented. Finally, while acknowledging the explosive growth of natural language processing and machine translation as a branch of it that cannot be reversed, the room for human translators to complement machine translation was suggested. This study presents a new approach to liberal arts education research by combining data analysis techniques using natural language processing and machine translation discussions.
1. 서론
2. 방법론
3. 분석 결과 및 논의
References