워드 임베딩을 이용한 관광여행지 선호도 비교에 대한 실증 연구
An Empirical Study on Comparison of Tourist Destination Preference using Word Embedding : Focusing on SNS users on the Gangneung tourism area
- 글로벌경영학회
- 글로벌경영학회지
- 글로벌경영학회지 제17권 제6호
- : KCI등재
- 2020.12
- 54 - 71 (18 pages)
본 연구는 워드임베딩의 단어표현기법을 이용하여 관광여행지 선호도 분석을 위한 실증 연구를 수행하고, 강릉 관광여행지 방문자의 네이버블로그와 인스타그램 이용자를 대상으로 비교 분석하여 살펴보았다. 이를 위해 워드임베딩기법인 Word2vec, GloVe 모델을 이용하여 중심단어의 주변단어 의미와 전체 말뭉치(Corpus)를 이용하여 단어 간의 의미를 반영하였다. 네이버블로그와 인스타그램 이용자 게시글 중에서 ‘강릉’ 키워드가 언급된 2019년 12월 10일 이전에 게시된 글을 대상으로 각각 2500개 데이터를 수집하여 이용하였다. 실증분석 결과 네이버블로그 이용자는 관광, 맛집, 커피, 여가를 주로 즐기는 것으로 판단된다. 이는 네이버블로그 이용자들이 주로 40대부터 60대인 것과 관련이 있는 것으로 판단된다. 인스타그램 이용자는 데이트, 미용, 취미, 맛집, 여가, 관광을 주로 즐기는 것으로 판단된다. 이는 인스타그램 이용자들이 주로 10대부터 30대인 것과 관련이 있는 것으로 판단된다. 즉, 관광여행지 추천 시에 이용자의 연령은 중요한 요소인 것으로 판단된다. 관광여행지 선호도 분석을 위해 Word2vec(w=10), Word2vec(w=20), GloVe 모델을 이용하고, 이중에서 Word2vec(w=10) 모델이 이용자의 관광여행지 선호도를 잘 표현하는 것으로 판단된다. 이는 SNS 이용자가 게시 글 작성 시 서술형으로 표현하기 보다는 핵심 키워드를 중심으로 게시글을 작성하는 것으로 판단된다. 본 연구의 실증결과는 관광여행지를 추천하는 경우, 관광객에게 만족도가 높은 관광여행지를 추천하는데 워드임베딩 단어표현기법(Word2vec, GloVe 모델)을 이용하여 여행자가 선호하는 관광지, 맛집, 데이터코드 등을 추천하는데 활용될 수 있을 것으로 보인다. 또한, 임베딩벡터(Embedding vector) 연산을 이용하여 이용자 맞춤서비스 개발에도 활용할 수 있을 것으로 기대된다.
This study conducted an empirical study to analyze the preferences of tourist destinations using the word expression method of word embedding, and compared and analyzed targeting the users of Naver blog and Instagram Gangneung tourist destination visitors. To this end, the word embedding method, Word2vec, GloVe model, was used to reflect the meaning of the surrounding words and the meaning between the lines using the whole corpus. Among the articles posted by Naver Blog and Instagram users, 2,500 data were collected and used for articles posted before December 10, 2019 when the keyword Gangneung was mentioned. As a result of empirical analysis, it is judged that users of Naver Blog mainly enjoy tourism, popular restaurants, coffee, and leisure. It is judged that this is related to the fact that Naver blog users are mainly in their 40s to 60s. It is judged that Instagram users mainly enjoy dating, beauty, hobbies, popular restaurants, leisure, and tourism. It is judged that this is related to the fact that Instagram users are mainly in their 10s to 30s. That is, it is judged that the user s age is an important factor when recommending tourist destinations. Using Word2vec(w=10), Word2vec(w=20), and GloVe models to analyze the preferences of tourist destinations, it is judged that Word2vec(w=10) model, among them, is expresses the preferences of tourist’s destinations of users. It is judged that SNS users write posts based on key keywords, rather than expressing them in narrative form when writing posts. The empirical result of this study recommends tourist destinations with high satisfaction to tourists, and it seems that it will be used to recommend tourist destinations, popular restaurants, and data codes which tourists prefer by using word embedding expression method (Word2vec, GloVe model). In addition, it is expected that it can be used to develop customized services using embedding vector arithmetic operations.
Ⅰ. 서 론
Ⅱ. 이론적 배경
Ⅲ. 연구방법
Ⅳ. 실증 분석 결과
Ⅴ. 결 론
참고문헌