论文部分内容阅读
近年来,喷涌式的数据增长使得用户经常处于被海量数据淹没的状态,而无法获取到真正想要的内容,因此推荐系统便应运而生。推荐系统是通过用户以往的行为特点、兴趣爱好和社交关系等信息来预测用户对商品的喜好,引导用户浏览他们需要和感兴趣的商品。推荐系统不仅节省了用户寻找信息或商品的时间,极大地提升了用户的使用体验,此外也可以为信息或商品提供者带来可观的收入增加。协同过滤算法是最早提出,当下应用最为广泛的一种推荐技术,其中协同的概念是指根据大量用户对商品的选择而综合过滤进行推荐的含义。相较于传统的协同过滤推荐算法,现有的协同过滤推荐算法通常假设商品间或用户间并非完全独立存在,充分考虑商品之间和用户之间的结构联系或属性联系来提高推荐精度。然而,目前用户间的关系数据往往在一些网站中不易收集和获取,同时商品间关系的计算维度又较为单一,导致推荐结果差强人意。本文通过运用关联规则算法挖掘多商品间的隐式关联关系,在概率矩阵分解模型的推荐框架下,融合本文提出的商品关联度公式计算得到的多商品隐式关联度,以解决单纯计算两商品相似度带来的商品间关系数据单一而导致的推荐准确性低下,同时本文提出的推荐算法避免了引入额外维度的参考信息,从而降低数据获取的难度,使算法拥有更好的扩展性。此外,我们还发现用户的兴趣漂移现象是普遍存在的,随着时间的变化,用户的兴趣爱好或购买倾向都会产生变化,为了能够解决用户的兴趣漂移问题,我们由新闻推荐中的用户阅读领袖思想引申到商品间的时序影响行为。用户阅读领袖指的是用户社交圈中有影响力的阅读领导者浏览同一新闻的时间点总比跟随者早,有明显的时序关系。由此我们提出了商品时序影响模型来刻画当前商品被用户喜欢时,其他商品被跟随喜欢的概率,从而可以得到用户整体的兴趣偏好随时间的变化趋势,提高最终的推荐效果降低评分预测误差。本文在上述基于关联规则和时序关系的推荐算法的基础上,对由关联规则挖掘到的多商品隐式关联关系和由商品时序影响模型生成的商品时序关联网络进行融合,再通过提出的时序影响因子将多商品隐式关联度和商品时序影响力结合,使得选择商品邻居时更加准确和多样,充分地利用了商品关系提高推荐精度,一定程度上克服了评分数据稀疏带来的商品邻居关系计算粗糙的问题,也缓解了用户兴趣漂移导致的推荐精度降低,因此得到预测评分更加准确。在公开的电影评分数据集Movie Lens上的实验结果显示本文提出的算法在用户关系数据无法获得的情景下,能有效地充分利用商品间多种关系来降低评分预测误差,对现实电子商务网站中进行商品推荐具有重要的指导意义。