论文部分内容阅读
随着互联网的迅速发展,互联网上的新增信息量呈爆发式增长,用户无法有效的获取有价值的信息,面临着日益严重的信息过载问题。作为克服信息过载问题的一个重要方法,个性化推荐系统顺应潮流地迅速发展起来,并被应用到各种各样的互联网服务中,如电商网站、电影音乐社区等。传统的基于协同过滤的个性化推荐算法以群体智慧的思想为基础,使用用户与物品之间的交互信息(即用户在网站上的历史行为记录,如购买记录、评分记录等)建模,以此来衡量用户对物品的偏好程度。为了进一步提高推荐系统的效果,基于人们容易接受来自朋友的推荐这一现实生活中的现象,研究者把协同过滤的思想应用到社交网络信息中,通过在个性化推荐系统中融入社交网络信息来提升推荐的准确性。然而,在真实的个性化推荐系统中,除了用户与物品间的交互信息以及用户间的社交网络关系信息以外,还有很多用户或物品的相关信息。这些相关信息隐含着用户与物品的特征,可以被引入到推荐系统中,从而提高推荐的效果。如何有效的融入不同类型的相关信息,是个性化推荐系统研究领域面临的一个新的挑战。本文把复杂的个性化推荐系统抽象成双星图模式,并提出一种新的基于双星图的矩阵分解方法。该方法通过添加基于用户或物品的相关属性相似性正则化项,使目标用户或目标物品的潜藏因子与其他相似的用户或物品的潜藏因子更接近。通过添加新的正则化项,该方法有效地向矩阵分解模型中融入了用户或物品的多种相关属性信息,从而提升高推荐系统的性能。为了验证新方法的有效性,本文抓取了一个较大规模的豆瓣电影数据集,其中除了用户与电影间的历史评分记录,还包括用户间的社会网络关系信息,用户的居住地及其加入的兴趣小组,电影的类型、导演和演员等属性信息。为了更好的进行对比实验,我们还实现了几个时下流行的基于矩阵分解的协同过滤模型,包括基于概率矩阵分解的协同过滤、基于社会化矩阵分解的协同过滤以及基于协同式矩阵分解的协同过滤。在豆瓣数据集中,对新方法和这几个流行的方法进行对比。主要考查不同方法在有效性对比实验以及冷启动性能对比实验的表现。通过实验,可以展示出本文提出的基于双星图模式的矩阵分解方法比其他对比方法对评分预测得更准确,并且在缓解冷启动问题上更有效。因此证明了我们提出的方法可以有效的融入更多的信息,并以此提升推荐性能。