论文部分内容阅读
互联网的迅速发展,使得信息量急剧增长,为用户带来便利的同时也面临着信息过载的问题,因此推荐系统作为一种有效的解决方法迅速发展起来。推荐算法作为推荐系统的核心,近些年受到了广泛的研究。矩阵分解是推荐算法中常用的一类经典而重要的技术,到目前为止仍受到广泛的关注和研究。传统的矩阵分解利用用户隐特征和物品隐特征的内积来预测评分,但是该方法通常会面临数据稀疏性的问题。近年来,深度学习在自然语言处理和图像分类等领域被证明能够提取好的特征表示,因此大量研究者将深度学习引入到推荐系统以解决数据稀疏性问题。但目前的研究中还存在以下问题:首先,现有的方法没有充分结合评分信息和辅助信息,不能学习到多数据源信息的联合特征表示;其次,利用自编码器提取的特征和评分预测的特征不在同一个特征空间,现有的推荐算法没有考虑到两者的差异性,从而影响了推荐准确率;最后,现有的方法仅用到单特征向量,不能准确地表示用户偏好。针对现有方法中存在的以上问题,本文开展了深入的研究工作。本文的主要工作内容如下:1.深入研究了现有的个性化推荐算法和结合了深度学习的个性化推荐算法,并对其进行了相应的分析和总结,找出现有研究中存在的不足。2.基于自编码器的思想,提出了一种新的特征提取模型——Semi-SDAE。现有的特征提取模型大多只能处理单一的数据源问题,很难融合多数据源信息。为了得到更丰富的特征表示,本文提出了一种基于自编码器的特征提取模型,该模型不仅更好的融合了多种数据源信息,也去除了自编码器输入数据和输出数据必须相等的限制,使得模型更加符合实际中的情况。3.基于矩阵分解的思想并结合特征提取模型Semi-SDAE,提出了一种自适应矩阵分解推荐算法——SAMF。现有的推荐算法将自编码器提取的特征直接用于评分预测任务,没有考虑到特征提取和评分预测这两个任务的差异性。本文针对该问题进行研究,提出了一种自适应矩阵分解推荐算法,使得提取出的特征能够更有效地应用于评分预测。4.为了解决矩阵分解中单特征向量预测精度低的问题,本文提出了一种层级多粒度矩阵分解推荐算法——LMGMF。该算法不仅克服了利用单特征向量不能准确表示用户偏好和物品特征的问题,同时也克服了现有的基于深度学习的推荐算法存在的仅利用最后一层来做预测,却忽略了神经网络每层特征变换带来的信息损失问题。5.在真实数据集上进行实验验证,本文提出的算法在推荐准确率上优于对比的多种个性化推荐算法,验证了本文所提出算法的有效性。