论文部分内容阅读
近几年来,推荐系统发展迅速,作为一种常用的协同过滤推荐算法,矩阵分解模型得到了广泛的应用,本文重点研究如何有效使用矩阵分解作为基本模型进行评分预测。我们将集成学习与矩阵分解相结合,来实现更大限度地解决不同数据类型带来的对预测评分的不同影响。当前,互联网中的个性化推荐显得越来越重要,我们使用融合了用户与物品自身喜好特性的SVD++模型进行个性化的推荐,为了更好地实现快速有效的个性化推荐,我们将SVD++与皮尔逊系数以及关联式规则相融合,对用户进行更深层次的个性化的推荐,提高推荐的准确率和效率。(1)第二章中,我们对现有的矩阵分解模型进行深入研究后,将集成学习与矩阵分解结合在一起,进一步挖掘数据的内在不均衡性。通过对矩阵分解模型的集成,进一步提高了推荐算法的预测精度,集成方法可以在一定程度上规避数据的不均衡性与冗余性。从结果上看,基于集成的矩阵分解模型较传统的矩阵分解模型在预测精度上有了一定的提高。(2)第三章中,在总结了第二章的算法后,我们考虑到第二章中的基于集成的矩阵分解虽然较矩阵分解来说推荐精度有了一定的提高,但是矩阵分解模型未能将用户或者物品自身的内在关联信息考虑在内,而这些隐含的内在信息在协同过滤推荐算法上应用后可以在很大程度上提高推荐的准确率。SVD++也是一种矩阵分解模型,它引入了隐式反馈,使用了用户历史评分数据。但是,SVD++算法将用户所有的历史评分数据考虑在内,复杂度高,耗时大,在实际的应用中不太实际。为此,我们挖掘物品间的潜在信息,关联式规则是一种有效的挖掘数据内在关系的方法,本章中,我们将每个用户标记过的物品看成一个词条,由于这些词条里的物品是一起被标记过的,因此他们之间在很大程度上存在着一定的关联。因此,我们使用关联式规则处理这些词条,挖掘出词条中的关联物品项,在训练模型时,使用这些关联物品项来更新用户和物品的特征矩阵。(3)第四章中,我们从另一个角度来挖掘物品间的相似项集。本章使用皮尔逊系数挖掘物品的相似物品集合,第三章中的关联式规则是将每个用户标记过的物品看成一个词条,是从用户角度出发的。这里我们从物品角度出发,将每个物品被用户标记之后所给出的评分看成一个向量,据此计算物品间的相似度,找出每个物品的相似项集。在训模型的过程中使用物品的相似项集合来代替用户标记的所有物品,来实现有效的加速。