토픽 모델링을 활용한 대통령기록물 이슈 탐색 자동화에 관한 연구

A Study on Automated Issue Detection in Presidential Records through Topic Modeling

DOI : 10.29279/jitr.2023.28.3.173
대통령기록물은 사회·정치적 변화와 지향점이 기록되어 강력한 공적 담론을 형성하면서, 사회 전반에 걸친 중요이슈들과 밀접한 관련이 있다. 따라서 대통령기록물을 보존하고 활용하는 과정에서 관련 사회 이슈들이 함께 고려되어야 한다. 이에 본 연구에서는 기존에 수행되던 일회성 이슈 탐색에서 더 나아가 관련 이슈들을 주기적으로 자동 탐색할 수 있는 방안을 제안하고자 한다. 이를 위해 대통령기록물 이슈 탐색 자동화 모델을 제안하고, 최근 5년간의뉴스미디어를 수집하여 실제 모델 검증을 수행하였다. 신규 데이터 획득 및 전처리, 토픽 모델링을 위한 최적 조건분석, 토픽 모델링 분석, 신규 이슈 탐지 과정을 거친 결과, 모델을 통해 도출된 대통령기록물 관련 신규 이슈들의유용성을 시각화와 사례 확인을 통해 검증하였다. 결과적으로 대통령기록물 관련 주요 이슈들이 효과적으로 탐지되어 유용성을 검증하였다.

Presidential records, which capture the essence of social and political transformations, are closely related to understanding of important societal issues. Therefore, any endeavor to preserve and harness presidential records must also encompass concurrent consideration of related social issues. This study aims to propose a method that can periodically and automatically identify key issues, marking a departure from the one-off issue detection approaches previously employed. In view of this, we introduced an automated issue detection model specifically designed for presidential records, and verified its efficacy through an extensive collection of news media data from the past five years. The results were derived in several phases: acquisition of new data, preprocessing, optimal condition analysis for topic modeling, and topic modeling analysis. The newfound issues pertinent to presidential records were validated through visualization and case studies. Consequently, the study validated the usefulness of this approach by effectively identifying major issues concerning the presidential records.

Ⅰ. 서 론

Ⅱ. 대통령기록물 이슈 탐색 자동화

Ⅲ. 모델의 검증

Ⅳ. 결 론

