상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
160704.jpg
KCI등재 학술저널

프랑스어 인용문의 자동 추출

신문 기사를 중심으로

  • 7

본 연구는 프랑스어 신문 텍스트에 나타나는 인용문을 자동 추출하고 의미 주석을 자동으로 부가하는 방법을 제시하고자 한다. 신문 기사에서 인용문의 출현 양상은 매우 다양하므로 자연언어처리에서 인용문의 경계를 획정 짓기가 어렵다. 이에 본 연구에서는 인용문을 ‘타인이 말하거나 말했던 것을 글로 전달하는 담화의 한 유형’으로 한정하고, 인용문을 구성하는 요소들(발화 주체, 도입소, 피인용절)을 자동 인식 지표로 제시한다. Maurice Gross의 부분문법 방법론에 근거하여 구성요소들을 분석한 후, 이 지표들을 근거로 직접인용, 간접인용, 혼합인용과 같은 다양한 유형의 인용문의 부분문법 그래프를 각각 구축한다. 끝으로, UNITEX 프로그램을 활용하여 구축된 그래프의 결과를 제시한다.

Ce travail a pour but de proposer une méthode de l’extraction automatique de discours rapportés aux textes journalistiques français et de l’annotation automatique du corpus. La variété des types de discours rapportés dans les articles de journaux ne facilite pas une délimitation de frontières des discours rapportés lors d’un traitement du langage naturel. Pour résoudre cette difficulté, cette étude propose tout d’abord une définition stricte du discours rapporté comme « un type de discours permettant à l’énonciateur de citer les paroles d’autrui par l’écrit ». Nous présentons ensuite les éléments constitutifs d’un discours rapporté (le sujet parlant, l’introducteur et le discours cité) comme les indicateurs pour un repérage automatique. Par l’analyse des constituants de discours rapportés – basée sur la méthodologie de Grammaires locales de Maurice Gross – nous construisons les graphes de divers types de discours rapportés, dont les discours directs, discours indirects et discours mixtes, à l’aide des indicateurs du repérage automatique. Enfin, nous présentons notre résultat des graphes construits par le logiciel UNITEX.

1. 서론

2. 인용문에 관한 예비적 논의

3. 인용문 자동 추출을 위한 지표

4. 인용문 자동 인식을 위한 부분문법 그래프 구축 및 결과

5. 결론

참고문헌

로딩중