论文部分内容阅读
当前,数据稀疏性问题已经成为现有的推荐算法亟待解决的挑战之一。为了缓解该问题,学术界已经对推荐算法展开深入研究,通过挖掘可能影响推荐性能的各种因素,进而从不同角度对推荐算法不断地改进和优化。项目之间的关联信息可以为推荐系统提供比较重要的信息,然而现有的大部分要么仅考虑项目之间的全局关联,要么仅考虑项目之间的局部关联,很少会同时考虑这两种项目关联。另外,传统的推荐算法大部分的应用范围都局限在单个领域中,而实际情况中单个领域往往数据都非常稀疏;若是利用跨领域推荐的思想,现有的大部分跨领域推荐算法适用于辅助领域和目标领域之间有共享用户或项目的应用场景,并不适用于两个领域中不存在任何共享用户和项目的应用场景;如果从辅助领域中迁移了与目标领域不相关的信息,则很可能会造成负迁移问题。针对以上问题,本文提出了两种面向稀疏数据的协同深度推荐模型。一种是基于项目全局和局部相似性的协同深度推荐模型。为了解决数据中存在的稀疏性问题,我们同时考虑项目之间的全局和局部关联信息,从而设计了一种基于项目全局和局部相似性的协同深度推荐模型。该模型更是一个通用的框架,可以根据处理项目信息的不同而选择不同的深度神经网络。本章提出的模型通过将矩阵分解模型和去噪自动编码机模型紧密整合在一起,从而将评分信息和项目内容信息进行结合,使得从评分信息中学得的项目潜在表示和从项目内容信息中提取的项目潜在特征之间相互影响。另外,模型提供了一种全新的视角来将项目之间的关联信息整合到推荐模型中。我们引入了流形正则化,并应用该技术直接从项目内容信息中同时学习项目之间的全局和局部关联。除此以外,我们在三个不同稀疏程度的数据集上进行了广泛的实验,实验证明GLICR模型在性能上显著优于其对比算法,同时GLICR模型在缓解数据稀疏性问题方面也体现了不错的性能。另一种是基于深度选择性迁移网络的跨领域推荐模型。为了从辅助领域中仅选择那些对目标领域有用的用户信息迁移到目标领域中,我们设计了一种深度选择性迁移网络。另外,为更好地学习目标领域的项目表示,我们考虑了目标领域的项目内容信息。通过将项目内容信息紧密整合到深度选择性迁移网络中,形成了本章所提出的DSTN模型,因此DSTN模型是一个跨领域混合推荐模型。另外,DSTN模型也可以视为一个通用的框架,可以根据处理项目信息的不同而选择不同的深度神经网络。具体来说,本章提出的模型利用了一个在目标领域和辅助领域共享的去噪自动编码机处理用户信息,考虑到自动编码机的学习过程是无监督的,从而引入矩阵分解将评分矩阵作为监督信息。通过该深度选择性迁移网络一方面可以从辅助领域中选择出对目标领域有用的用户信息迁移到目标领域,另一方面可以学得目标领域的用户和项目潜在因子表示。与此同时,通过一个目标领域私有的去噪自动编码机从目标领域的项目内容信息中提取出项目潜在特征表示,然后利用提取出的项目潜在特征表示影响深度选择性迁移网络中目标领域的项目潜在因子表示的学习。除此以外,我们在两个真实数据集上进行了广泛的实验,实验证明本章提出的DSTN模型在性能上不仅显著优于传统的面向单个领域的对比算法,同时也显著优于现有的跨领域对比算法,并且可以适用于辅助领域和目标领域中不存在任何共享用户和项目的应用场景中。