상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
152989.jpg
KCI등재 학술저널

협업 여과기법의 추천 성능 개선을 위한 유사도 척도 비교

Comparison of Similarity Measures for Performance Improvement of Collaborative Filtering

  • 3

웹 추천시스템의 주요 과제 중 하나는 사용자에게 제공하는 추천 성능을 높이는 것이다. 사용자 기반 협업 여과기법은 웹 추천시스템에서 가장 널리 사용되고 있는 기법 중 하나이다. 사용자 기반 협업 여과방식은 먼저 사용자간의 유사도를 평가한다. 다음에 유사도가 높은 이웃 사용자를 K명 선정하고, 이웃 사용자의 선호도를 이용하여 각 상품의 선호 예측치를 평가한다. 마지막으로 선호 예측치가 높은 순서로 N개의 상품을 추천한다. 사용자간의 유사도를 측정할 때 사용하는 대표적인 척도는 피어슨의 상관계수이다. 이 연구에서는 피어슨의 상관계수 대신 가중치 유클리디언 거리 기법과 역사용자빈도 또는 유의가중치를 결합한 유사도 척도를 적용하여 사용자간의 유사도를 측정하고자 한다. 또한 각 상품의 선호 예측치를 평가하기 위한 방법으로는 가중치 순위 방법을 적용한다. 각 기법에 대해 MovieLens 데이터에 적용하여 실험을 하고 F1 지표로 추천 성능을 비교한다. 실험결과 가중치 유클리디언 거리 기법과 유의가중치를 활용하는 경우 피어슨 상관계수 기법보다 추천 성능을 개선할 수 있음을 보였다.

One issue of the Web recommender systems is to improve the performance of recommendation of some items for active users. User-based collaborative filtering is one of the popular methods for the recommender systems. First, it evaluates similarity between two users. Next, it selects the K nearest neighbors with high similarity for each active user. And it estimates prediction value of each item for the active user. Finally, it recommends N items with high prediction value to the active user. The Pearson correlation coefficient is a popular measure evaluating the similarity between two users. This study proposes several combined similarity measures such as weighted Euclidean distance, inverse user frequency, and significance weighting instead of Pearson correlation coefficient. It also suggests weighted rank method to estimate the prediction value of each item for the active user. Next, it experiments those techniques using MovieLens dataset, and compares the recommendation performance of them. In experiments results, we showed that the performance of the recommender system using the weighted Euclidean distance and significance weighting for similarity measure was better than that of the Pearson correlation coefficient.

1. 서론

2. 협업 여과기법

3. 추천시스템 성능 평가 방법

4. 실험 및 분석

5. 결론 및 향후 연구

참고문헌

로딩중