텍스트 마이닝(Text Mining)에 의한 표준과 표준교육의 빅데이터 분석

Big Data Analysis of Standards and Standards Education by Text Mining

이 연구의 목적은 빅데이터 기법을 활용하여 표준 관련 연구 동향을 분석하는 것이었다. 연구의 목적을 달성하기 위해 2017년 5월 1일부터 12월 30일까지 리스포유에서 ‘표준’, ‘표준교육’ 등의 키워드 검색을 통해 도출된 총 441편의 학술 자료를 대상으로 빅데이터 분석하였다. 이 연구에서 사용 된 빅데이터 분석 방법은 텍스트 마이닝(Text Mining)이었다. 분석을 위해 사용된 프로그램은 R 프로그램이다. R 프로그램의 ‘tm’, ‘RColorBrewer’, ‘wordcloud’, ‘qcc’, ‘KoNLP’ 패키지를 이용하여 불용어와 기호를 삭제하고 자연어 처리기술 중 형태소 분석을 통해 문장을 최소단위로 쪼개는 작업을 진행하였다. 이를 통해 학술자료 제목에 주로 나타나는 단어의 빈도수를 파악하고 이 결과를 R 프로그램의 크라우딩 패키지를 활용하여 워드크라우드로 제시하는 것으로 분석을 실시하였다. 이 연구에서 도출된 결과는 다음과 같다. 먼저 1시기(2007~21011) 사이에 가장 많이 언급된 단어는 ‘표준’이었다. 표준이외에 빈도수가 높은 단어는 ‘교육과정’, ‘교육’, ‘과정’, ‘보육’이었다. 2시기(2012~2014) 사이에 가장 많이 언급된 단어는 ‘교육’이었다. 다음으로 ‘표준’, ‘발명’, ‘국가직무능력’, ‘역량’ 등이 상위에 있었다. 3시기(2015~2017)에 가장 많이 언급된 단어는 ‘과정’이었다. 다음으로 ‘발명’, ‘국가직무능력’, ‘역량’ 등이 상위에 있었다. 표준 관련 연구는 1시기, 2시기, 3시기에 거쳐 계단식으로 양적 성장을 보였으며 핵심적인 키워드는 ‘교육과정’, ‘교육’, ‘과정’, ‘보육’, ‘발명’, ‘국가직무능력’, ‘역량’ 이었다.

The purpose of this study was to analyze trends in standards-related research using Big Data techniques. In order to achieve the purpose of the study, Big data analysis was conducted on 441 academic materials derived from keyword search such as standard and standard education from May 1, 2017 to December 30. The types of big data analysis methods were text mining techniques. ‘Tm’, ‘RColorBrewer’, ‘word cloud’, ‘qcc’, ‘KoNLP’ were used package in R. It was to delete the words and symbols that do not require and by using the morphological analysis of the natural language processing technology made the statement as a minimum unit. In this paper, we analyze the frequency of word appearing in the title of academic articles and present it as a word crowd using the R program s crowding package. The results of this study are as follows. First, the most frequently mentioned word during the first period (2007 ~ 21011) was ‘standard’. In addition to the standard, the most frequent words were ‘curriculum’, ‘education’, ‘course’, and ‘childcare’. The most frequently mentioned word between the two periods (2012 ~ 2014) was education. Next, there were ‘standard’, ‘invention’, ‘national incompetence’ and ‘competence’. The word most often mentioned in the third period (2015 ~ 2017) was the ‘process’. Next, there were ‘inventions’, ‘national incompetence’, and ‘competence’. The standardized researches showed quantitative growth through the 1 st, 2 nd, and 3 rd periods, and the key keywords were ‘Curriculum’, ‘Education’, ‘Process’, ‘Child Care’, ‘Invention’, ‘National Disability’ And ‘competence’.

Ⅰ. 서 론

Ⅱ. 이론적 배경

Ⅲ. 연구 방법

Ⅳ. 연구 결과

Ⅴ. 결론 및 제언
