이 연구는 빅데이터 분석을 위한 머신러닝 기법을 활용하여 테러리즘 관련 정형, 비정형 빅데이터 분석을 실시하고, 테러리즘 예측 가능성을 확인한 뒤, 시사점을 도출하는 것을 목적으로 한다. 이를 위해 테러리즘 전문 연구기관으로부터 테러리즘 빅데이터를 입수하고, 각종 포털과 SNS 상에 게시되어 있는 글과 문서를 수집하여 머신러닝에 투입한 뒤, 분석과 학습을 실시하여 결과를 확인하였다. 분석 결과는 다음과 같다. 첫째, 머신러닝 기법 중 대표적 비지도학습인 K-Means Clustering을 실시한 결과 2021년 전 세계에서 발생한 테러리즘의 지역별 군집은 8개(아프가니스탄, 콩고민주공화국, 인도, 이라크, 미얀마, 나이지리아, 파키스탄, 소말리아 근방)로 확인되었다. 다음으로 테러리즘 유형 별로 군집화를 실시한 결과 8개의 군집에서 폭발물을 제외한 무기를 사용한 암살과 납치 또는 유괴, 기간시설을 대상으로 한 테러리즘 유형이 확인되었다. 이와 더불어 테러리즘에 활용된 수단을 중심으로 군집화를 실시한 결과 폭발물이 앞도적으로 많았으나 군집에 따른 차이점이 존재하는 것으로 확인되었다. 마지막으로 테러리즘의 대상을 중심으로 군집화를 실시한 결과 군, 경찰, 정부인사, 민간인 및 사유재산에 대한 군집을 확인할 수 있었다. 둘째, 테러리즘 사건에 관한 비정형 텍스트를 연구대상으로 설정하여 감성분석을 실시한 결과 테러리즘 연구자와 일반인 사이에는 테러리즘을 대하는 시각과 관점의 차이가 존재함을 확인할 수 있었다. 이와 같은 연구결과를 중심으로 테러리즘을 예방할 수 있는 방안에 대한 정책적 제언을 실시하였다.
The purpose of this study is to analyze terrorism-related structured and unstructured big data using machine learning techniques for big data analysis to confirm the predictability of terrorism and derive implications. To this end, big data on terrorism was obtained from research institutes specializing in terrorism, articles and documents posted on various portals and SNS were collected, put into machine learning, and analyzed and learned, and the results were confirmed. The analysis results are as follows. First, as a result of conducting K-Means Clustering, a representative unsupervised learning among machine learning techniques, eight regional clusters of terrorism occurred around the world in 2021 (near Afghanistan, Democratic Republic of the Congo, India, Iraq, Myanmar, Nigeria, Pakistan, and Somalia). Next, as a result of clustering by type of terrorism, assassination using weapons excluding explosives, kidnapping or kidnapping targeting key facilities were identified. In addition, as a result of clustering around the means used in terrorism, it was confirmed that there were many explosives ahead, but there were differences according to the cluster. Finally, clusters of military, police, government personnel, civilians, and private property were identified as a result of clustering centered on targets of terrorism. Second, as a result of sentiment analysis by setting unstructured texts on terrorism events as research subjects, it was confirmed that there were differences in views on terrorism between terrorism researchers and the general public. Based on these research results, policy suggestions were made on ways to prevent terrorism.
Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구방법
Ⅳ. 분석결과
Ⅴ. 결론