
Stylometry를 이용한 영화 흥행 예측
Prediction for the Films Success using Stylometry
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.17 No.2
- : KCI등재
- 2015.04
- 719 - 728 (10 pages)
최근 스마트폰 등 모바일 장치의 대중화로 인하여 시간과 장소에 구애받지 않고 인터넷에 접속할 수 있는 소셜 미디어 시대로 들어섰으며 이러한 환경에서 기업이나 국가는 소셜 미디어 분석을 통한 가치 있는 정보 획득을 최우선 과제로 설정하고 있다. 더욱이 요즘 들어 다양한 분야에서 빅데이터가 발생하고 있고 이러한 빅데이터를 활용한 성공사례가 증가하고 있는 상황에서 음악이나 영화 컨텐츠 산업과 같은 문화 컨텐츠 분야에서 빅데이터 분석 역시 흥미있는 주제로 자리잡고 있다. 본 연구에서는 소셜 미디어 분석에서 핵심적인 분석방법인 텍스트 마이닝을 소개하고 텍스트 마이닝 분석 방법 중 Stylometry 방법에 대한 고찰과 이를 이용한 영화 흥행 예측을 시도하고자 한다. 분석 도구로는 R 프로그램을 이용하였고 온라인 상의 영화 댓글 데이터 수집부터 흥행 예측을 위한 소셜네트워크 분석까지 실제 사용한 R 프로그램을 제시하였다. 사례분석에서는 Stylometry 기법을 이용하여 흥행영화인 “명량”을 기본 데이터로 하여 같은 시점에 동시 개봉한 두 개의 후보 영화(제보자, 슬로우 비디오) 중 상대적으로 더 흥행을 할 영화를 예측하였고 예측 결과는 “제보자”로 나타났다.
In recent years, another interesting application field of text mining techniques has been stylometry research. Textual stylometry deals with identifying the linguistic style of text documents. Typical research topics are the authorship identification problem, i.e., who wrote a specific text passage, or linguistic forensic tests. The advance of text mining techniques and computing power has led to a steady rise in usage of text mining for stylometry. Classical textual stylometry mainly deals with historical documents subject to unclear author-document correspondence. Examples are poems of Shakespeare, books of the Wizard of Oz, or the Federalist Papers. In this paper we introduce text mining in Stylometry using R and predict the movie success. In case study, we predicted that ‘Jeboja’ would be more successful than ‘Slow Video’ using Stylometry method.
1. 서론
2. 텍스트 마이닝과 Stylometry
3. 사례분석
4. 결론
References