상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
커버이미지 없음
학술저널

문서 유사도 기법을 활용한 이슈 키워드 추출 방법 - 인터넷 뉴스 기사를 대상으로 -

Issue Keyword Extraction Method Using Document Similarity Method - Focused on Internet Articles -

  • 253

2016년 국내의 뉴스 이용에 관한 조사에 따르면 인터넷 뉴스 이용자는 약 70%이고, 이 중에서 76%는 포털 사이트에서 뉴스를 이용하는 것으로 나타났다. 또한 모바일 인터넷을 통한 뉴스 이용률 은 70.6%를 기록했다. 이렇게 뉴스를 접할 방법은 다양해졌으나 인터넷 상에서 뉴스를 선택하기 위한 정보는 헤드라인, 언론사와 본문 첫 1~2 문장이 전부다. 이를 위해 본 논문에서는 최근 검색 포털에 서 검색 순위에 나타나는 검색어의 형태로 제공하는 것이 사용자들의 편의성을 반영하는 것으로 판 단하여 사용자에게 제공할 또 다른 정보로 해당 기사와 기사가 다루고 있는 이슈의 키워드를 선정했 다. 또한 기사의 키워드와 이슈 키워드를 추출하기 위해서는 TF-IDF와 코사인 유사도를 활용하여 추 출한다. 포털 사이트에서 사회, 정치, 경제면의 조회수 1위 기사와 이와 유사한 복수의 기사들을 연구 의 대상으로 선정하였고 이를 대상으로 각 키워드를 추출한다. 향후 본 연구는 관련 이슈를 문장으로 요약하는 연구로 활용될 것으로 기대한다.

1. 서론

2. 관련 연구

3. 문서 유사도 측정 및 키워드 추출

4. 결론

References

로딩중