한국어-아랍어 기계번역에 관한 고찰
A Study on Korean-Arabic Machine Translations: Focused on Non-Literary Texts
- 한국아랍어아랍문학회
- 아랍어와 아랍문학
- 26집 2호
- : KCI등재
- 2022.08
- 65 - 87 (23 pages)
5,060개 단어 분량의 2개의 한국어 강의용 비문학텍스트에 대한 GNMT 번역 결과물과 인간번역 결과물 간의 차이를 정량적, 정성적으로 분석하였다. 전체 오류 중 화용 범주가 41%로 가장 많이 나타났고, 어휘 범주 37%, 문화, 정보 범주 18%, 통사 범주 4%로 나타났다. 오류의 원인은 다양하게 나타나는데 화용 범주의 오류는 문맥을 고려한 의미 선택의 어려움과, 연어와 관용어 등 자연스러운 어휘표현의 어려움, 주술 호응 일치의 어려움 등으로 보인다. 어휘 범주의 오류 원인은 원문 단어의 1:1 기계적인 대응 번역과 한국어-아랍어 언어쌍의 학습데이터 자원의 부족으로 보인다. 기계번역으로 나타나는 화용 범주의 오류들과 문화, 정보 범주의 오류들은 해결하기 어렵고 포스트에디팅이 필요하다. 기계번역과 인간번역의 차이점은, 기계번역은 문맥을 고려하지 않고 원문의 단어를 1:1 대응시켜 번역하여 번역투가 많이 나타나고, 인간 번역은 문맥을 고려하여 원문의 단어를 번역할 때 다양한 대안에서 창의적으로 선택한다는 점이다.
In this study, the difference between the GNMT translation and human translation of two non-literary texts for Korean lectures of 5,060 words was quantitatively and qualitatively analyzed. The pragmatic category of the total errors, was the most common at 41%, the lexical category 37%, the culture and information category 18%, and the syntactic category 4%. There are various causes of errors, and errors in the pragmatic category appear to be difficulties in selecting meanings in consideration of context, difficulties in expressing natural vocabulary such as collocations and idioms, and difficulties in matching of subject and predicate. The cause of the error in the lexical category seems to be the 1:1 mechanical correspondence translation of the original word and the low resources of training data for the Korean-Arabic language translation. Errors in the pragmatic category and cultural and information category appearing in machine translation are still difficult to solve and require post-editing. The biggest difference between machine translation and human translation is that GNMT mechanically translates words from the original without considering the context, and humans creatively choose one among various lexical alternatives when translating words in the original text.
Ⅰ. 서론
Ⅱ. 선행연구
Ⅲ. 연구 내용과 방법
Ⅳ. 분석 결과
V. 결론
참고문헌