상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
학술저널

텍스트마이닝을 통해 분석한 지역별 고유 구비설화 전승의 면모 -지명전설과 인물전설을 중심으로

The Aspect of the Transmission of Oral Narrative Unique to Each Region Analyzed through Text Mining: Focusing on Legends of Place Names and Historical Figures

  • 150
커버이미지 없음

본고는 전국 9개 지역에서 수집된 구비설화 자료집 『한국구비문학대계』와 『증편 한국구비문학대계』에서 지명전설과 인물전설을 파악하고 이를 목록화하는 작업을 수행하였다. 이를 위해 텍스트마이닝 기법을 활용하여 ‘데이터 수집→ 지역 정보 전처리→ 고유명사 전처리→ 지역 설화 분석→ 데이터 생성’의 분석 과정을 거쳤다. 즉 먼저 구비설화 제목 데이터 26,542편을 수집하여 ‘도’ 단위의 행정구역으로 정리되지 않은 지역 정보를 전처리하였다. 그런 후 이 데이터를 9개 지역별로 분류하였다. 그 다음으로는 형태소 분석기가 명사로 인식하지 못하는 고유명사를 찾아 명사로 등록해주는 작업을 하였다. 이때 고유명사는 ‘연관어 네트워크’ 분석기법을 사용하여 찾았다. 이와 같은 고유명사를 확인·수정하는 전처리 작업이 끝나면 각 지역별 명사의 빈도수를 추출하였다. 그런 다음 지역의 고유성을 담보하는 명사들을 선별하기 위해 빈도수를 ‘정규화’하고 그 값을 ‘스케일링’하였다. 그리고 각 지역 고유의 지명과 인물을 선별하기 위한 기준을 ‘최대 지역 점유율’이라는 용어로 정의하고 이를 80%로 선정하였다. 그 결과 520개의 명사가 추출되었고 여기서 지명과 인명에 해당하는 고유명사만 가려냈다. 이를 토대로 지명전설에 해당하는 지명은 각 지역별로 ‘증거물의 성격’에 따라 ‘자연물’, ‘인공물’, ‘마을이름’으로 분류하여 목록화하였다. 인물전설에 해당하는 인명도 각 지역별로 제시하였다. 지명전설은 지역민들의 ‘역사가 교차하는 공간’으로 자신들의 삶의 터전을 어떻게 형상화하고 의미화했는지를 보여준다는 점에서 긴요하다. 한편 인물전설은 ‘그 지역민의 역사적 인식이 쌓인 시간’과 문자 기록에서 소외되거나 배제된 지역 인물을 살필 수 있다는 점에서 주목되어야 한다.

This study identified and cataloged the legends of place names and historical figures from a compilation of oral narratives collected from nine regions nationwide, as documented in the 『Comprehensive Korean Oral Literature』 and the 『Complementary Edition of Comprehensive Korean Oral Literature』. For this, text mining techniques were employed, involving the analysis process of “data collection → preprocessing of regional information → preprocessing of proper nouns → analysis of regional folklore → data generation.” First, we collected data on 26,542 oral narrative titles and preprocessed the regional information, which was not organized by administrative divisions at the “provincial” level. Subsequently, we categorized the data into nine regions. Next, we conducted a task to identify proper nouns that were not recognized by the morphological analyzer and registered them as nouns. In this process, we used the “associated word network” analysis technique to identify proper nouns. Once the preprocessing task of verifying and modifying the proper nouns was completed, we extracted the frequency of the nouns in each region. Then, to select nouns that guarantee the uniqueness of the region, the frequency was “normalized” and the value was “scaled.” Additionally, the criterion for selecting the unique place names and people of each region was defined by the term “maximum regional share” and selected as 80%. As a result, 520 nouns were extracted, of which only proper nouns corresponding to place and personal names were filtered. Based on this, for legends of place names, place names were classified into “natural features,” “artificial features,” and “village names” for each region, according to the “nature of the evidence.” This list has been compiled. In the legends of historical figures, the corresponding personal names are presented for each region. Legends of place names are crucial as they reveal how residents of each region shape and give meaning to their lives in the “space where history intersects.” However, legends of historical figures deserve attention for their exploration of individuals in the region who have been marginalized or excluded from historical awareness accumulated over time and documented in written records.

1. 서론

2. 텍스트마이닝을 활용한 각 지역 고유의 설화 추출 과정

3. 각 지역 고유 설화의 전승 현황

3.1. 지명전설

3.2. 인물전설

4. 결론

(0)

(0)

로딩중