
인공지능형 뉴스 언어 데이터베이스의 구축과 이의 적용 가능성에 관한 연구: 국내 30개 언론사의 기사와 사설을 중심으로
A Study on the Establishment and Applicability of an Artificial Intelligence-based News Language Database: Focusing on Articles and Editorials from 30 Domestic Media Outlets
- 연세대학교 사회과학연구소
- 사회과학논집
- 제55권 제2호
- : KCI등재
- 2024.11
- 1 - 27 (27 pages)
본 연구는 알고리즘 기반의 자동 텍스트 분석 관점에서 출발해 국내 언론사의 기사와 사설이 재현되는방식을 파악해 그 결과를 데이터베이스로 구축하고자 했다. 이를 위해 선행 연구가 도출한 결과와 지침을바탕으로 2021년 8월 22일부터 2주간 무작위 설정 주간을 사용해 주요 종합일간신문, 방송사, 종합편성채널등이 보도한 사건 기사와 기획 기사, 사설 16,800건을 수집했다. 본 연구는 선행 연구 결과를 참고해 구조, 범주, 하위 범주, 변수라는 틀을 개발한 뒤에, 이를 수집한 자료에서 추출한 관련 단어와 연결했다. 이 자료를본 연구는 ‘뉴스 언어 데이터베이스’라고 명명했다. 이 데이터베이스는 40개의 변수와 이에 속하는 단어40,909건을 탑재했다. 이 데이터베이스로 분석한 결과, 기자들이 기사나 사설을 쓸 때 사실 전달 중시, 문어성 표현, 취재원 의존, 중립적 정보 취급 등의 경향이 있는 것으로 나타났다. 또한, 평가, 기대, 예상 등을논평으로 제시하거나 맥락이나 배경을 설명하거나 해석이나 후속 반응을 다루는 정도는 낮았다. 외래어와일본어 투가 비교적 많이 등장했다. 이 데이터베이스를 검증하는 차원에서 2023년 1월 한 달간 신문, 방송사, 인터넷 언론사, 뉴스 통신사가 정치를 소재로 보도한 기사와 사설을 분석했을 때도 유사한 모습이 나타났다.
This research aimed to analyze how the contents of articles and editorials reported by major domestic media outlets are reproduced from the perspective of algorithm-based automatic text analysis. The goal was to establish the results as a database. Based on the results and guidelines of prior research (Lim, 2021), two random weeks were selected. During this period, 16,800 data were collected, including incident articles, feature articles, and editorials reported by major domestic daily newspapers, broadcasting companies, or comprehensive programming channels. Referring to previous research results, this study developed a framework consisting of structure, categories, subcategories, and variables, which were then connected to relevant words extracted from the collected data. The data in this study were named the “News Language Database.” It included 40 variables and 40,909 corresponding words. The final version of this database revealed that when journalists from domestic media outlets write articles or editorials, they prioritize factual reporting while employing a significant amount of written expression and relying on sources. They tend to neutrally present the information provided by these sources in the news texts. Moreover, the analysis showed a low occurrence of evaluation, expectations, predictions, explanations of context or background, interpretations, or follow-up responses. The usage of foreign language terms and Japanese expressions was relatively high. In terms of verification, an analysis of political articles and editorials from newspapers, broadcasting, an online media outlet, and a news agency during January 2023 revealed similar reporting patterns.
Ⅰ. 문제 제기
Ⅱ. 이론적 고찰
Ⅲ. 연구 방법
Ⅳ. 분석 결과
Ⅴ. 논의와 결론
참고문헌