본고는 인공지능(AI)을 활용한 중국어 자연어처리(텍스트마이닝) 실습 교육의 기초적 적용을 다룬다. 최근 다수의 대학 중국어 관련 학과에서는 중국어 텍스트 데이터를 대상으로 한 텍스트마이닝 교육 과정을 개설하여 운영하고 있다. 이는 융복합적이고 실용적인 교육이 중국어문학 분야에서도 중요한 과제로 부상하고 있음을 보여준다. 본 연구에서는 AI(ChatGPT5)를 활용하여 중국 인터넷 상의 중국어 텍스트 데이터를 수집하는 크롤링(crawling) 기법과, 이를 바탕으로 워드클라우드(word cloud)를 생성하는 교육 방법을 제시한다. 특히 AI(ChatGPT5)를 효과적으로 활용하기 위해서는 적절한 프롬프트(prompt)의 설정이 핵심적이므로, 본고는 프롬프트 설계 과정을 중심으로 논의를 전개하였다. 구체적으로, 크롤링을 수행하기 위해서는 우선 대상 사이트의 화면 구조를 면밀히 분석하고, 그에 맞추어 프롬프트를 설계해야 한다. 경우에 따라 단순히 URL 정보를 입력하는 것만으로 충분할 수 있으나, URL 정보만으로는 원하는 데이터를 수집하기 어려운 상황에서는 HTML 코드까지 반영한 정교한 프롬프트 설정이 요구된다. 이러한 과정에서 단 한 번의 시도로 만족스러운 결과를 얻을 수도 있으나, 대체로 여러 차례의 오류와 수정을 거쳐 최적의 코드를 도출하게 된다. 본고는 이러한 일련의 과정을 체계적으로 소개함으로써, 중국어 텍스트마이닝 실습 교육에 있어 AI 기반 도구의 적용 가능성과 교육적 활용 방안을 탐색하고자 한다. 또한 본 연구에서는 실제 교육 적용 과정에서 발생한 문제점과 그 해결 방안을 탐구하고자 한다. 첫째, 주요 문제점으로는 프로그래밍 기초 지식이 부족한 학생들을 대상으로 교육이 이루어진다는 점을 들 수 있다. 이에 따라 교육은 프로그래밍적 방법론에 기반한 접근보다는 생성형 AI에 전적으로 의존하게 되며, 반복적으로 발생하는 오류를 신속하게 해결하는 방안을 모색하는 것이 중요한 과제가 된다. 모범 코드를 직접 제시하여 설명하는 방법도 가능하나, 본 교육의 궁극적 목표는 학생들이 독립적으로 AI를 활용할 수 있도록 하는 데 있다. 따라서 오류 발생 시 이를 AI와의 상호작용을 통해 해결하도록 유도하는 것이 핵심 교육 전략으로 설정된다. 둘째, 생성형 AI의 특성상 학생들이 산출하는 코드가 일률적으로 동일하지 않다는 점 또한 문제로 지적된다. 동일한 과제를 수행하더라도 학생별 코드 유형이 상이하게 나타나며, 그에 따라 데이터 업로드 방식, 파일 인코딩 적용 방식 등 세부 절차에서도 차이가 발생한다. 이러한 다양성은 개별적 지도와 맞춤형 지원을 필요로 하며, 교육자는 유형별 문제 상황을 정리하고 그에 따른 해결 방안을 마련해야 한다. 본고에서는 이와 같은 실제 교육 과정에서 발생하는 문제점들을 유형별로 제시하고, 이에 대한 구체적 해결 방안을 논의하고자 한다.
This paper presents an introductory application of artificial intelligence (AI) in Chinese text mining education. Recently, many Chinese language programs have introduced courses using text data for text mining, highlighting the growing need for interdisciplinary and practice-oriented instruction. We demonstrate an approach that employs AI (ChatGPT-5) to collect Chinese text data via web crawling and to generate word clouds for visualization. Since effective outcomes depend on prompt design, we emphasize how webpage structures are analyzed and translated into prompts. While simple URL input may suffice in some cases, more complex cases require HTML code. The process often involves iterative refinement until satisfactory results are obtained. The study also examines challenges in classroom practice. First, students lacking programming backgrounds tend to rely entirely on generative AI, making efficient error resolution a key task. Although model codes may be provided, the instructional goal is to guide students toward independent AI use, encouraging them to resolve errors through AI interaction. Second, because generative AI produces non-uniform code, variations occur in data upload methods, encoding, and related procedures, requiring individualized support. By outlining these processes and issues, the paper highlights the potential of AI-based tools for practical Chinese text mining education and their value in fostering digital literacy in language studies.
1. 서론
2. 중국어 텍스트 크롤링
3. 중국어 텍스트 워드클라우드 생성
4. 중국어 리뷰 텍스트 감성 분석
5. 교육에서의 난점 및 해결 방안
6. 결론
參考文獻
(0)
(0)