상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
post.jpg
학술대회자료

워드 임베딩 방법에 따른 딥러닝을 활용한 가짜뉴스 판별 모델에 관한 연구

  • 43

정보화 기술과 미디어화의 가속화 속에 가짜뉴스가 우리 사회의 심각한 문제로 대두되고 있 다. 이에 가짜뉴스를 판별하는 모델을 개발하여 가짜뉴스 노출에 취약한 현시점에서 유해한 영 향을 줄이고 신뢰성 있는 정보 전달에 기여하고자 한다. 자연어를 처리하는 방법 중 단어 임베 딩 방법을 기반으로 한 딥러닝 모델을 통해 가짜뉴스를 판별해 내고 그 모델의 성능을 높이고자 다양한 워드 임베딩 방법을 소개하고자 한다. 워드 임베딩 방법은 뉴스 텍스트 데이터에서 의미 있는 특징을 추출하고, 단어 간 의미적 유사성을 파악하는 방법인데, 이 방법을 활용하여 뉴스 기사의 실제 내용과 일치하지 않는 정보를 식별하여 가짜뉴스를 판별하고자 한다. 각 워드 임베 딩 방법인 TF-IDF, Word2Vec, FastTextt의 embedding matrix를 생성하고, 가짜뉴스 판별 모델인 딥 러닝 기반 LSTM 모델에 임베딩층의 가중치를 적용한 후, 모델의 정확도(accuracy)를 비교하여 더 우수한 워드 임베딩 방법을 제시하였다. 본 연구의 사례 분석을 통해 모델의 정확도를 비교 한 결과 Word2Vec 방법이 TF-IDF와 FastText보다 더 우수한 결과를 얻었다.

로딩중