AI 시대에 부응하여 기계 언어를 기반으로 한 텍스트 처리 방법이 다양한 분야에서 널리 활용되고 있다. 통계적 방법의 장점을 활용하여 텍스트 자동 처리에 적용하는 것이 국내외 말뭉치 언어학 연구의 주요한 방향이 되었다. 본고는 Python 자연어 처리 기술을 활용하여, 거시적 관점에서 중국공산당전국대표대회의 제19차 및 제20차 보고서를 대상으로 단어 빈도 분석, TF-IDF 추출, 의미 네트워크 분석, 신조어 분석을 진행하였다. 이를 통해 보고서에 나타난 언어 사용 방식과 그 변화를 비교하고, 보고서의 전체적인 내용을 정확히 파악할 수 있었다. 또한, 언어적 변화를 통해 시진핑 시대의 중국 특색 사회주의 사상의 발전과 혁신을 조망할 수 있었다. 연구 결과는 고빈도 단어의 부각이 시진핑 연설의 핵심 정보를 효과적으로 도출할 수 있음을 보여준다. TF-IDF를 통해 텍스트 내용을 정제하고, 보고서만이 지니는 핵심 사상을 드러냈다. 의미 네트워크 분석은 키워드 간 내재된 논리적 관계를 밝혀내어 텍스트의 핵심 구조를 시각적으로 나타냈다. 신조어 발견은 중국공산당전국대표대회의 제20차 보고서에서 등장한 새로운 단어를 식별하고 추출하여 시대 상황에 따른 정부의 조정 방향을 파악하는 데 기여했다. 이러한 텍스트 마이닝 기술을 통해 텍스트 내용을 전체적이고 체계적으로 분석할 수 있었으며, 이는 심층적인 이해와 추가 연구를 위한 과학적 근거와 지원을 제공한다.
In response to the AI era, text processing methods based on machine languages are diverse It is widely used. Utilizing the advantages of statistical methods, applying them to automatic text processing has become the main direction of domestic and international corpus linguistics research. Using Python natural language processing technology, this paper conducted word frequency analysis, TF-IDF extraction, semantic network analysis, and new word analysis on the 19th and 20th reports of the CPC National Congress from a macroscopic point of view. Through this, it was possible to compare the language use method and its changes shown in the report, and to accurately grasp the overall contents of the report. In addition, through linguistic change, it was possible to view the development and innovation of socialist ideology characteristic of China in the Xi Jinping era. The results of the study show that the highlight of high-frequency words will effectively derive key information from Xi Jinping's speech It shows that it is possible. The text content was refined through TF-IDF and the core ideas of only the report were revealed. The semantic network analysis revealed the inherent logical relationship between keywords and visually indicated the core structure of the text. The discovery of new words contributed to identifying and extracting new words that appeared in the 20th report of the Communist Party of China National Congress to understand the direction of government adjustment according to the situation of the times. Through this text mining technology, it was possible to analyze the text content in a holistic and systematic manner, which provides scientific basis and support for in-depth understanding and further research.
1. 들어가며
2. 연구대상 및 방법
3. 텍스트 마이닝 분석 결과
4. 신조어 발견
5. 나가며
(0)
(0)