论文部分内容阅读
推荐系统是解决信息过载的有效途径,它应用已有的用户历史评价行为对用户实施个性化推荐。推荐算法作为推荐系统的核心,它的性能直接决定着推荐系统的好坏。协同过滤推荐算法是推荐系统应用最为广泛和成功的技术之一。然而,随着用户数和项目数不断地增加,协同过滤技术遇到了数据稀疏性、可扩展性等挑战。为了缓解数据稀疏性的问题,迁移学习通过应用具有较多训练数据的辅助领域学习到的知识,迁移到目标领域中以帮助提高目标领域推荐系统的推荐精度。本文从迁移学习的角度研究协同过滤算法,提出了三个迁移学习模型,分别适应目标领域和辅助领域数据分别的不同情形。(1)为了提高传统协同过滤推荐算法的用户兴趣相似度计算的准确性,构建了一种用户兴趣相似度迁移的协同过滤模型,利用辅助领域的用户兴趣相似度帮助目标领域用户兴趣相似度的学习。分析了模型中影响平衡参数大小的因素,并提出了一种特征子空间的距离近似地估计该平衡参数,提高了模型的智能性。通过真实数据的实验验证,模型能够准确地计算目标领域的用户兴趣相似度,从而提高了推荐系统的推荐精度。(2)为了帮助目标领域用户评价特征的学习,在矩阵分解模型的基础上提出了一种基于用户特征迁移的协同过滤推荐算法。采用SOFT-IMPUTE算法解决辅助领域中带核数的最小均方问题,并以此构造辅助领域的用户特征。设计了一种快速收敛的Wiberg算法求解用户特征迁移模型。同样通过实验验证,该模型能够有效地对辅助领域的用户特征进行迁移,显著提高了目标领域的推荐质量。(3)为了解决辅助领域和目标领域用户特征维度可能不一致的情形,构建了一种用户特征子空间迁移的协同过滤推荐算法。利用辅助领域的用户特征子空间到目标领域用户特征空间的投影距离来度量不同领域间的用户特征的相似度,在此基础上对辅助领域的用户特征子空间进行迁移。此外,提出了一个迭代算法对目标模型的最优化问题进行求解。仍然通过真实的数据进行实验验证,该方法能够有效的缓解数据稀疏性的问题。通过以上的研究工作,在一定程度上有效地缓解了协同过滤算法遇到的稀疏性问题,从而在一定程度上推动了迁移学习在协同过滤推荐算法的应用和研究。