본 연구는 현재 존재하고 있는 신경망 기계번역의 한계나 문제점들을 한국어 다의동사 ‘가다’를 중심으로 한중번역의 대응 양상을 고찰하면서 신경망 기계번역의 다의 동사 처리 능력을 검증하였다.신경망 기계 번역인 파파고, 구글, 바이두를 검색한 결과 파파고에서 가장 높은 다의 동사 처리 능력을 보였고, 구글의 다의어 처리 능력은 현저히 떨어지는 것으로 나타났다. 의미적인 면에서는 입력 언어와 대응되는 출력 언어가 사전적 원의미로 공통 의미를 가지고 있을 때 적은 오류를 나타냈으며, 입력 언어의 다의 동사가 가지고 있는 의미가 출력 언어의 다른 동사로 대응되어야 하는 경우에 많은 오류가 발견되었다. 한국어 다의 동사 ‘가다’의 경우에는 중국어로 번역될 경우, 중국어의 ‘去’의 의미 항목에 없는 의미에서 대부분 번역 오류가 나타났다. 따라서 여전히 신경망 기계번역의 다의어 처리 능력은 많은 한계를 가지고 있는 것으로 보여 진다. 특히 문어체 위주의 텍스트를 번역하기에 유용한 것으로 분석되는 구글 한중 기계 번역에서 구어 텍스트와 맥락에 따른 어휘 의미 처리의 취약성이 현저히 드러났다. 신경망 기계 번역이 편리하고 유용한 번역 도구로서의 제 기능을 잘 발휘할 수 있기 위해서는 신경망 번역의 오류를 보완할 수 있는 데이터 축적이 많이 이루어져야 한다. 본 논문의 연구에서는 다의 동사 ‘가다’를 중심으로 연구하였지만 향후에 보다 많은 다의어 처리 결과 분석 연구가 이루어졌으면 한다.
This study analyzes the limitations and problems of the existing neural network machine translation, examining the correspondence patterns of Korean-Chinese translation, focusing on the Korean polysemous verb “가다(gada),” and verified the ability of neural network machine translation to process polysemous verbs. As a result of searches for neural network machine translations using Papago, Google, and Baidu, Papago showed the highest processing ability in terms of processing polysemous verbs, while the ability to process polysemous verbs in Google was significantly lower. In terms of meaning, when the output language corresponding to the input language had a common meaning as defined by a primary dictionary meaning, there were few errors. However, when the meanings of polysemous verbs in the input language had to correspond to other verbs in the output language, many errors were found. In the case of the Korean verb “gada,” most translation errors appeared in meanings dissimilar to the meaning of “去(qu)” in Chinese, when it was translated into Chinese. Thus, it seems that the polysemous verb processing ability in neural network machine translation still has many limitations. In particular, Korean-Chinese machine translation in Google, which is evaluated as useful for translating written text, showed a significant vulnerability in processing vocabulary meaning based on spoken text and context. To enable neural network machine translation to function effectively as a convenient and useful translation tool, there must be more data accumulation to compensate for errors in neural network translation. Although the research in this paper focused on the multi-verb 'gada', we hope that more polysemous verbs processing results will be analyzed in the future.
1. 서론
2. 한국어 동사 ‘가다’와 중국어 ‘去’의 의미 비교
3. 신경망 기계번역의 양상과 오류 분석
4. 결론
(0)
(0)