상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
152976.jpg
KCI등재 학술저널

비정형화된 속성의 학습을 통한 자동화된 내용 기반 필터링 기법의 개발

Development of an Automated Content Based Filtering Method By Learning Non-Structured Features

  • 2

본 연구에서는 비정형화된 속성의 학습을 통한 자동화된 내용 기반 필터링 기법을 개발하였다. 기존의 내용 기반 필터링 기법은 사용자의 선호 정보와 각 콘텐츠 또는 상품의 프로파일 정보를 비교하여 각 사용자가 선호할만한 상품을 추천하는 기법이다. 그러나, 각 콘텐츠 또는 상품의 프로파일 정보를 관리자가 일일이 입력해야하는 번거로움과 속성을 정확히 정의하는 것이 매우 어려우므로, 기존의 내용기반 필터링 기법은 범용적으로 사용되지 못하였다. 그러나, 본 논문에서 개발한 방법은 기존의 내용 기반 필터링 기법과는 달리, 콘텐츠 또는 상품의 속성을 관리자가 일일이 정의할 필요가 없다. 즉, 기존의 내용 기반 필터링 기법의 한계점을 극복한 것이다. 본 연구에서 개발한 기법의 절차는 다음과 같다. 첫째, 각 문서의 형태소 분석을 통해 자동적으로 그 문서의 속성을 정의하게 된다. 둘째, 각 문서로부터 등장한 많은 형태소 중, 문서의 변별력에 도움이 되는 의미 있는 단어들을 추출하여, 이를 키워드 집합으로 정의한다. 셋째, 각 사용자의 키워드 선호도를 수치적으로 결정한다. 이는 각 사용자가 읽은 문서의 키워드를 문서의 위치 및 빈도수를 고려하여 결정된다. 마지막으로, 각 사용자별 키워드 선호도와 새로 등장한 문서의 키워드 집합을 대조시킨 다음, 가장 적절한 문서를 사용자에게 추천하게 된다. 본 연구에서 개발한 기법의 효용성을 검증하기 위해 실험용 뉴스 사이트를 운영하였으며, 개발한 방법의 우수성을 입증하였다.주요용어 : 내용 기반 필터링, 추천 시스템, 키워드 선호도, 정보 추출.

In this article, an automated content based filtering method was developed using learning non-structured features. Conventional content based filtering is a scheme for recommendation and uses user s preference information and profile of each content or product. However, content based filtering method was not used commonly since it is difficult and complicated for administrator to define the features of contents or products properly. Unlike the conventional content based filtering, the proposed approach is not required to define features of the contents or products. That is, the proposed approach overcome the limitation of the conventional content based filtering. The proposed method consists of the following four phases. First, a morphological analysis of the text is carried out in order to automatically define features of the text (i.e. news page). Second, for each text, a keyword set is defined based on the frequency and location of the words within the text. Third, each user s keyword preference is numerically determined. This process is carried out using the weighted count of keywords of the text which the user has selected. Finally, a recommended contents are generated based on the user s keyword preference and keyword sets of the new contents. The effectiveness of the proposed approach is assessed using an experimental news site. It is found that the recommended news pages by the proposed approach were clicked more than popular news or prompt news pages.

I. 서론

II. 내용 기반 필터링 기법의 개요

III. 개발한 내용 기반 필터링 기법

IV. 실험 평가

V. 결론

참고문헌