상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
학술저널

생성형 AI를 활용한 『불한사전』(1869) 필사본의 번역과 디지털화 연구

Une étude sur la traduction et la numérisation du manuscrit du Dictionnaire français-coréen(1869) au moyen de l'IA générative

  • 4
프랑스학연구 제109권.png

본 연구는 1869년 파리외방전교회 신부인 페롱이 집필한 『불한사전』 필사본의 디지털화를 위해 사전의 영인본을 판독하고 전자 입력한 텍스트를 생성형 AI(Claude 4.5)를 활용하여 번역하고 구조화는 방법론을 제안한다. 필사본의 영인본으로만 접근이 가능하여 활용이 극히 제한적이었던 이 사전은 19세기 한국어와 프랑스어의 언어적 교류를 보여주는 중요한 역사 언어학 자료로서, 현대 국어사전에서 찾을 수 없는 옛 어형이나 19세기 구어, 지역적 변이형 등을 담고 있어 한국어사 연구에 중요한 가치를 지닌다. 본 연구에서는 『불한사전』의 뜻풀이를 다섯 가지 유형으로 분류하고, 퓨샷러닝(Few-Shot Learning) 기법을 적용하여, 비정형 텍스트의 자동 번역과 구조화를 시도하였다. 20개의 학습 예제를 통해 AI를 학습시키고 33개의 테스트 데이터를 통한 실험 결과, 번역과 구조화의 정확도는 각각 93.9%로 나타났으나, 전체 처리 정확도는 63.7%에 그쳤다. 주요 오류 유형으로 구조화 태그 누락, 정의되지 않은 약어 처리 실패, 문장 경계 인식 실패, 원문 변형 등이 확인되었다. 이를 통해 AI 기반 고문헌 디지털화의 가능성과 한계를 실증적으로 제시하며, 향후 프롬프트 규칙 고도화, 학습 데이터 강화, 그리고 전문가 검수가 필수적임을 확인할 수 있었다.

Cette étude propose une méthodologie utilisant l'IA générative (Claude 4.5) pour numériser le manuscrit du Dictionnaire français-coréen (1869) de Stanislas Féron. Ce dictionnaire constitue une ressource précieuse pour l’histoire de la langue coréenne, contenant des formes archaïques et des variantes du coréen du XIXe siècle introuvables dans les dictionnaires modernes. Nous avons classé les définitions en cinq types et appliqué le few-shot learning pour automatiser la traduction et la structuration de textes non standardisés. Après entraînement avec 20 exemples, les tests sur 33 données ont révélé un taux de 93,9% de précision pour la traduction et la structuration respectivement, mais seulement 63,7% de précision globale. Les erreurs principales incluent l'omission de balises structurelles, l'échec du traitement d'abréviations non définies, la reconnaissance incorrecte des limites de phrases et la modification du texte original. Cette recherche démontre empiriquement les possibilités et limites de la numérisation de dictionnaires et de documents historiques par IA, confirmant la nécessité d'affiner les règles de rédaction des prompts, de renforcer les données d'apprentissage et d'assurer une validation par des experts.

1. 들어가는 말

2. 선행연구

3. 연구방법

4. 테스트 결과 분석

5. 맺음말

참고문헌

(0)

(0)

로딩중