论文部分内容阅读
随着互联网信息量爆炸式地增长,推荐系统已成为解决信息过载问题的一种有效技术手段,它允许用户发现符合自己兴趣偏好的新项目,也能够将企业的项目定向投放到具体的人群。在现实世界中,隐式反馈相对于显式反馈而言,具有更广泛的可用性,因此一些研究人员已经努力基于隐式反馈来设计推荐系统。传统的协同过滤方法,例如使用矩阵分解模型,只是简单地将用户-项目之间的交互建模为它们潜在特征向量的线性组合,这在很大程度上限制了模型的表达能力。为此,一些研究人员已经设计了基于神经网络的协同过滤,探索深度神经网络在推荐系统中的应用,神经网络协同过滤就是其中最具代表性的方法之一。本文对神经网络协同过滤进行了深入研究和分析,并针对其不足提出了如下改进方案:(1)神经网络协同过滤将用户-项目之间的交互建模为更加复杂的非线性模型,提高了推荐性能的同时,使用了大量的模型参数,导致模型训练效率不高。本文经过认真研究分析发现神经网络协同过滤框架中的嵌入层是一个全连接层,该层中用户和项目的潜在因子矩阵也会作为整个模型参数的一部分参与训练。为了对嵌入层提前单独进行训练,减少后期模型训练的参数,提高模型的训练效率,本文通过引入隐式反馈嵌入模型提出了IFE-NCF框架,并将该方案应用于NCF框架的两个具体实现GMF和MLP,分别得到了IFE-GMF和IFE-MLP两个模型。(2)神经网络协同过滤仅仅依靠用户和项目之间的交互进行建模,在用户冷启动问题以及捕获密切相关的项目之间的关系上仍然表现不佳。具体地讲,神经网络协同过滤在建模时没有考虑项目与项目之间存在的某些联系,可能会限制模型的推荐效果。另外只使用用户与项目之间的交互行为来建模,不足以对历史交互行为较少的用户,即冷启动用户做出有效的推荐。对此,本文在IFE-NCF基础上引入了项目上下文,提出了基于项目上下文的IFE-NCF框架,将目标用户对测试项目的交互建模为两方面内容:一方面是目标用户对测试项目的表现,另一方面是测试项目与目标用户曾经交互的项目之间的关系。而且本文在基于项目上下文的IFE-NCF框架下具体实现了基于项目上下文的IFE-GMF和基于项目上下文的IFE-MLP两个模型。本文分别针对IFE-GMF和IFE-MLP,以及基于项目上下文的IFE-GMF和基于项目上下文的IFE-MLP进行了大量实验。实验结果表明IFE-GMF和IFE-MLP在不损失预测准确度的情况下,可以明显提高原模型的训练效率;基于项目上下文的IFE-GMF和基于项目上下文的IFE-MLP相较于原模型,在推荐性能上都有明显改进,并且有效缓解了用户冷启动问题。实验结果也表明在基于项目上下文的IFE-GMF和基于项目上下文的IFE-MLP两个模型的训练过程中,随着迭代次数的增加,它们的推荐性能都在不断提升,但是当迭代次数达到某个数值时,这两个模型的推荐性能都趋于稳定。此外,实验结果还表明增加神经网络隐藏层数可以明显提升基于项目上下文的IFE-MLP的推荐性能。