[摘要]随着互联网技术的飞速发展,个性化推荐系统在电子商务网站,社交网站等网络平台中的作用愈发重要,成为提高信息的利用率,改善用户网络体验的重要手段。而过协同滤技术以其简单、高效的特点,成为目前备受关注的推荐技术。
但传统的协同过滤推荐算法在实际应用中仍存在以下不足:
- 数据稀疏:随着推荐系统中的用户和资源数量的不断增加,系统难以有针对性的选择用户近邻进而给出有效的个性化预测;
- 冷启动:在项目和用户初始加入系统时,用户对其评分较少,使得在计算项目相似度时出现较大误差,影响推荐结果;
- 扩展性问题:由于用户的评分信息总是不断变化,所以每次推荐时,都要重新计算用户之间的相似度和最近邻集合,因此对用户信息丰富的系统来说,表现出了严重的扩展性能问题。
针对以上问题,论文根据腾讯微博在KDD Cup 2012 track1提供的数据,构建用户兴趣模型和项目模型,利用混合过滤推荐技术,向用户推荐其可能感兴趣的项目(微博信息)。
本文的主要工作与创新点如下:
- 利用用户基础信息、好友信息、及标签信息共同表达用户的偏好,构建用户兴趣模型。
- 针对具体模型,在传统相似度计算方法上进行改进,得到合适的相似度计算方法,提高推荐精准度。
- 通过中心最近邻和聚合最近邻的方法获得最近邻用户,以缓解数据稀疏、好友关系的传递性带来的误差。
- 论文结合传统基于项目的协同过滤算法和基于用户的协同过滤算法提出了基于层次兴趣模型的混合过滤算法,与传统的协同过滤算法相比,该算法一定程度上缓解了数据稀疏的问题,更好的应对冷启动问题,使推荐结果具有更强的鲁棒性。
[关键字] 相似度;最近邻用户;个性化推荐;协同过滤;混合过滤
[成果出处] 四川大学计算机学院视觉计算实验室(www.scuvis.org)
原文请自行联系作者索取。