키워드
초록
자연어는 인공어와 달리 컴퓨터가 직접 처리하기 곤란하여 이를 구조적인 데이터로 처리할 필요가 있다. 따라서 표본 텍스트에 단어의 가중치를 문서 내의 출현 빈도에 가중치를 부여하고 이를 근거로 일부의 단어를 키워드로 선택한다. 텍스트 마이닝의 정보 필터링을 통해 취임사 자료를 입력하고, 주제어 관련 연관성에 따른 특성값의 결과를 얻을 수 있어서 단순 어휘 빈도수보다 비정형 텍스트의 질적 향상을 도모할 수 있었다. 지금까지 이 연구에서는 대한민국 역대 대통령의 취임사 어휘를 분석하였다. 형태소 분석을 통해 단어를 정제한 후 어휘 빈도수와 특성값을 찾아내고, 워드 클라우드로 시각화하였다. 이 연구는 기존 어휘 분석의 단편적 분석이 아닌 특성값과 워드 클라우드를 통해 특성을 대표하는 객관적 주제어를 추출할 수 있었다.
Unlike artificial languages, natural languages are difficult for computers to process directly. Therefore, it is necessary to process it as structured data. In the end, by giving weight to the sample text, the frequency of appearance in the document was weighted. The inaugural address data was entered through information filtering of text mining, and it was possible to obtain the result of the characteristic value according to the relation to the main word. This study analyzed the vocabulary of the inaugural speeches of past presidents of the Republic of Korea. After refining words through morpheme analysis, we found vocabulary frequency and characteristic values, and the data was visualized in wordcloud. This study did not perform a fragmentary analysis of the existing lexical analysis. This study presented feature values and word clouds. Therefore, it was possible to extract objective keywords representing the characteristics of the keywords.
목차
1. 시작하는 말
2. 연구 내용 및 방법
3. 취임사 어휘 분석 결과
4. 끝맺는 말
참고문헌 (0)
등록된 참고문헌 정보가 없습니다.
해당 권호 수록 논문 (0)
등록된 수록 논문 정보가 없습니다.