상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
커버이미지 없음
KCI등재 학술저널

협업필터링 추천시스템에서 기초정보를 활용한 예측방법 조합에 관한 연구

A Study on Combinations of Prediction Methods by Using Basic Statistics in Collaborative Filtering Recommender Systems

DOI : 10.37727/jkdas.2019.21.2.733
  • 67

본 연구는 협업필터링 알고리즘에서 선호도 예측 전에 선호도 평가 정보를 이용하여 예측 정확도를 향상시킬 수 있는 방법에 대해 연구하였다. 사용자 기반의 방법에서 이웃기반 협업필터링 알고리즘과 아이템 기반에서 평가치 가중합 알고리즘을 선호도 예측에 사용하였다. 이웃기반 협업필터링 알고리즘에서 유사도 가중치로 Pearson 상관계수와 코사인 벡터를 사용하였으며 유사도 가중치를 공통 응답쌍으로 보정해 주는 유의성 가중치를 적용하였다. 아이템 기반의 가중 합 알고리즘에는 조정 코사인 벡터를 유사도 가중치로 사용하고 유의성 가중치도 적용하였다. 아이템 기반으로 제안된 가중합 알고리즘을 사용자 기반으로 적용하여 조정 코사인 벡터와 유의성 가중치를 적용한 예측도 실시하였다. 이상 8가지 방법에 의해 예측된 결과를 예측 전 사용자별 선호도 평가치의 평균과 표준편차를 기준으로 4분위로 구분한 후 각 분위에 포함된 사용자들의 예측 결과를 비교하였다. 각 분위에서 예측 결과가 가장 좋은 알고리즘을 선정하고 이들의 조합으로 예측된 결과를 8가지 결과와 비교하였다. 결과에서 평균의 4분위로 구성한 알고리즘 조합의 결과가 가장 우수함을 알 수 있었으며 선호도 예측 이전의 사전 정보를 이용하여 선호도 예측 정확도를 향상시키는 방법이 유효함을 알 수 있었다.

This study is devoted to improve prediction accuracy of collaborative filtering algorithm apply pre-evaluating each user’s ratings before prediction. Neighborhood based collaborative filtering algorithms in user based method and weighted sum algorithms in item based method are applied to preference prediction of user. Each of pearson correlation coefficient and cosine vector as similarity weight is applied to user based collaborative filtering algorithm and significance weight which devalues similarity weight according to numbers of rated items in common is also applied to algorithm. Weighted sum algorithm which is included item based collaborative filtering algorithm uses adjusted cosine vector as similarity weight and also applies significance weight to that algorithm. The results predicted by the above 8 methods are compared to each user’s prediction accuracy which are divided ratings quartile by each user’s mean and standard deviation before prediction. The best result of the 8 prediction methods in each quartile is selected and combine them to compare with the results of each 8 prediction. The results shows that the combination of algorithms, which is composed of each users’ mean quartile, is the most accurate and using pre-evaluation prior to preference prediction is a valid way to improve prediction accuracy.

1. 서론

2. 이론적 배경

3. 실험설계

4. 실험결과

5. 결론

로딩중