论文部分内容阅读
随着互联网的发展,网络信息过载。在这样的情况下,出现了推荐系统,它采用各种推荐算法与实际相结合,自动地为用户提供经济的、高质量的个性化推荐。协同过滤,通过收集他人的偏好为目标用户做推荐或评分预测,是构建推荐系统的最成功的方法之一。以前的许多推荐研究工作主要利用单一目标领域的评分数据或标记数据建立模型。此外,也有一些工作考虑利用用户和物品的外部信息(例如,用户的社交信息和物品的属性信息)来提高推荐性能。然而,用户或物品的外部信息有时不容易获得并且容易引进更多噪声。为了利用更多可用信息以提高推荐的准确性,迁移学习技术被应用到推荐系统中帮助系统进行协同过滤,被称为迁移协同过滤技术(TCF)。TCF技术旨在利用辅助领域的知识改善目标域中的推荐性能,大多数TCF方法从单一辅助领域中学习知识并迁移到目标领域。近来,研究学者提出了跨多领域的TCF方法来利用大量可用信息。现有的多领域TCF方法主要包括两种。一种需要辅助领域中的用户或物品存在交叉,即辅助领域之间共享用户或物品。然而,由于不同领域的用户或物品一般是不一样的,要求不同领域共享用户或物品的方法的应用范围有限。另一种分别对各个辅助领域进行迁移学习然后将不同领域的预测结果进行加权整合。然而,在多领域整合中,不同领域可利用信息并不一致。现有的多领域加权整合的方法为每个领域的迁移学习结果分配权重进行简单的结果整合,忽略了不同领域的数据分布差异性。对于上述方法的局限性,本文提出两个全新的跨多领域的迁移协同过滤推荐算法。首先,本文提出基于评分一致性的跨域迁移学习推荐算法(简称TRACER)。由于从不同数据源领域学习的知识都是用于预测相同目标领域的缺失评分,所以它们的预测结果应尽可能相似。基于这样的假设,本文设计了基于评分一致性约束的正则化项,该项约束不同领域迁移学习后的预测评分尽可能地相似。接着,本文提出了 TRACER算法。TRACER算法对传统的单领域迁移学习算法进行扩展,分别从多个源领域进行迁移协同过滤,同时约束多个领域的迁移学习预测结果趋于一致以预测目标领域的缺失评分。TRACER算法以评分一致性正则化项约束不同领域的预测结果最终一致,从而处理不同领域之间信息的不一致性问题。TRACER算法在两个真实数据集上表现优越,验证了算法在推荐上的有效性。另外,本文考虑到领域数据分布的差异性,提出了基于局部评分相似性的跨域迁移学习推荐算法(简称LOEN)。LOEN方法根据辅助领域对目标领域中待预测评分的相似评分的拟合程度,为不同领域的迁移学习结果分配权重,继而将其整合在一起以实现评分的个性化预测。与现有的TCF方法相比,LOEN方法考虑了不同领域之间的差异性以及同一领域评分之间的差异性,同时,LOEN方法不需要多领域的数据存在关联,因而方法更加通用和有效。在后续真实数据集上的有效性实验验证了 LOEN算法在推荐上的有效性,特别是在不相关领域上进行迁移学习推荐。