이 연구는 2017년 전 세계에서 발생한 테러리즘 사건에 대한 비정형 텍스트 데이터를 대상으로 텍스트 마이닝 분석을 실시하여 테러리즘과 관련된 주요 요인들을 확인하는 것을 목적으로 한다. 또한 테러리즘과 관련된 주요 요인을 추출하고 각 요인들 간의 상관관계를 분석하여 요인 간 관련성을 확인한 뒤, 이를 바탕으로 테러리즘 발생과 관련된 대응방안을 모색하는 것을 목적으로 한다. 이를 위해 GTD(Global Terrorism Database)의 2017년 테러 사건에 관한 비정형 텍스트 데이터를 수집하여 분석에 활용하였다. 분석결과 우선 자살테러와 관련된 문서 중 가장 높은 TF를 보인 단어는 ‘assail(739개)’이었고, 가장 높은 TF-IDF는 ‘iraq’로 확인되었다. 또한 자살테러와 관련된 문서의 주요 빈출 어휘로 ‘suicid’, ‘bomber’, ‘attack’, ‘claim’, ‘kill’ 등의 단어가 확인되었다. 즉, 정치적·경제적·사회적·종교적 목적을 달성하기 위해 본인의 생존을 담보로 테러를 저지른다는 자살테러의 정의와 동일한 결론을 보여주었다. 다음으로 자생테러의 경우 가장 높은 TF는 ‘attack(11,431개)’이었고, 가장 높은 TF-IDF는 ‘iraq’로 확인되었다. 또한 ‘devic’, ‘explos’, ‘blast’, ‘deton’ 등과 같은 단어가 높은 TF-IDF를 보여주었는데, 이를 통해 이라크에 서 가장 많은 자생테러가 발생했고, 자생테러에 주로 폭탄이나 폭발물이 사용된다는 점을 확인할 수 있었다. 마지막으로 자살테러와 자생테러를 제외한 일반테러의 경우 가장 높은 TF는 ‘attack(286개)’이었고, 가장 높은 TF-IDF는 ‘polic’로 확인되었다. 또한 ‘kenya’, ‘casualti’, ‘alshabaab’ 등이 높은 TF-IDF를 보였는데 이를 통해 경찰을 대상으로 한 테러가 많이 발생했으며 ‘Al-Shabaab’가 전 세계에서 가장 많은 테러를 자행했다는 사실을 확인하였다.
The purpose of this study is to identify major factors related to terrorism by conducting text mining analyses of unstructured text data on terrorism incidents worldwide in 2017. It is also aimed at extracting major factors related to terrorism and analyzing the correlation between each factor to identify the relevance between factors, and then exploring countermeasures related to the occurrence of terrorism. To this end, unstructured text data on the 2017 terrorist event of the Global Terrorism Database (GTD) was collected and used for analysis. First of all, the highest TF that related to suicide terrorism was assail(739)’, and the highest TF-IDF was iraq . In addition, words such as suicid, bomber, attack, claim and kill have been identified as the main excerpts of documents related to suicide terrorism. In other words, this showed the same conclusion as the definition of suicide terror, in which he committed terrorism on the basis of his own survival in order to achieve his political, economic, social and religious purposes. Second, the highest TF in the case of homegrown terrorism was attack (11,431), while the highest TF-IDF was identified as iraq . Words such as devic, explos, blast and deton also showed high TF-IDFs, which proved the most homegrown terror attacks in Iraq, and that bombs and explosives were mainly used in homegrown terrorism. Finally, the case of terrorism except suicide terrorism and homegrown terrorism, the highest TF was attack (286), and the highest TF-IDF was polic. They also showed high TF-IDFs such as Kenya, Casualti and al-shabaab, confirming that Al-Shabaab had the most attacks in the world against police.
Ⅰ. 서 론
Ⅱ. 이론적 배경
Ⅲ. 연구방법
Ⅳ. 분석결과
Ⅴ. 결 론