论文部分内容阅读
随着互联网的发展以及大数据时代的到来,影音资讯、电子商品等各类物品日渐丰富的同时,也使得用户往往需要耗费大量的时间和精力才能找到自己喜爱的物品。而推荐系统可以利用用户的历史日志等数据提取出有价值的信息来快速地为用户找到其喜爱的物品并提供推荐结果。从用户对推荐结果的反馈的角度对推荐系统问题进行区分,可以分为行为预测和评分预测。本文针对这两个问题,提出了基于时序模型的融合兴趣推荐算法和基于物品质量的打分模型。在行为预测问题中,推荐算法通过预测用户在下一时刻行为的概率,再根据概率的大小给出推荐结果,比如可能会看哪部电影,听哪首歌曲。用户兴趣分布捕捉的越准确,推荐算法给的的结果也就越好。以往的算法大多只考虑了用户兴趣中的一面,即只考虑了静态兴趣或者动态兴趣,然而这两种兴趣是存在互补性的。基于此我们提出了融合兴趣模型,将用户的静态兴趣和动态兴趣融合到了一起。首先,把用户的独热编码当作原始表达,来用来提取用户的静态兴趣。同时,将每个用户的消费历史记录按照时间顺序输入到循环神经网络,随后使用注意力层来提取用户的动态兴趣。最后,我们使用自适应机制来融合提取到的两类用户兴趣,得到最终的用户兴趣表达。我们在Movielens和TaoBao数据集实现了该算法。与现有算法比较本,我们的模型在Recall@N和Mrr@N指标上取得了更好的效果。此外,我们还设计了隐空间维度等因素对模型影响的实验,验证了我们模型的有效性。在评分预测问题中,推荐算法预先给出用户对未消费物品的预测打分,再根据物品打分的高低给出推荐结果。用户对物品的评分中既有好评也有差评,而导致用户给出不同评分的原因就是物品的质量存在高低。因此对于评分预测,推荐系统不仅要捕捉用户的兴趣分布,还要能够提取得到物品的质量信息。现有的推荐算法如协同过滤算法往往只考虑了用户的静态兴趣,而以循环神经网络为基础的时序推荐算法则忽略了物品的质量信息,使得推荐效果受到制约。针对以上问题,本文在融合兴趣模型基础上,进一步提出了基于物品质量的打分模型。在该模型中,通过输入用户对物品的评分矩阵计算得到物品和物品之间的相关信息,然后与融合兴趣模型相结合,从而既能够捕捉用户的兴趣分布,也能够提取得到物品的质量信息。最后我们在Movielens数据集上验证了模型的效果。通过跟现有算法对比,我们的模型在MAE和RMSE这两个指标上均有提升。同时,我们针对隐空间特征维度等因素设计了相关实验,来分析它们对模型的影响。