论文部分内容阅读
当前信息时代,伴随着信息的极大丰富,人们如何有效选择信息成为急需解决的问题。在这样的背景下,推荐系统因其高效性和智能性,而倍受学术界和工业界关注。传统的推荐算法虽然有不错的成绩,但同样存在很多问题,比如评分稀疏性、无法从知识层面分析内容、无法处理多媒体数据等等问题。 深度学习在语音识别、图像分析和自然语言处理任务的突出表现,为克服上述困难带来了曙光。同时,已有研究表明将深度学习应用到推荐系统中可以得到高质量的推荐。且在众多基于深度学习的推荐系统当中,存在相当可观的系统额外利用嵌入模型来提升系统的性能。因此本文对嵌入模型和基于深度学习的推荐模型进行系统的分析,并分别提出了新的模型,具体如下: 一、协同学习单词和字符表示模型。现有的嵌入模型大部分都是面向英文领域,面向中文的嵌入模型发展不足。而且已有的中文嵌入模型往往直接套用英文嵌入模型的思路,忽略了中文自身存在的特性。中文单词经常由多个字符组成,且字符包含了丰富的语义,因此本文提出了协同学习单词和字符模型。该模型在相同的语义空间下对单词和字符进行分布式表达,利用字符信息直接提升单词表示的质量。此外,此嵌入模型可以直接应用到基于嵌入模型的深度推荐模型中,间接提高推荐系统质量。本文在推理任务、词相似任务、文本分类任务和推荐任务上对词向量进行评估,实验表明字词协同学习的词向量优于单独训练的词向量。 二、基于监督卷积矩阵分解的文档推荐模型。本文总结了现有的基于深度学习的推荐系统模型:基于卷积矩阵分解的文档推荐(ConvMF)。ConvMF虽然采用卷积神经网络(CNN)捕获项目描述的上下文信息,但是CNN直接与评分矩阵交互,当评分矩阵非常稀疏时,模型推荐质量受到影响。本文通过加入标签信息来缓解评分矩阵稀疏问题,从而提出了新的深度推荐算法——基于监督卷积矩阵分解的文档推荐算法(Super-ConvMF)。Super-ConvMF网络通过标签和评分矩阵的联合监督,并且可以额外利用嵌入模型。本文在英文数据集上,对提出的推荐算法进行一系列分析,表明了基于监督卷积矩阵分解的推荐算法具备更好的推荐性能,且基于嵌入模型的深度推荐算法优于非基于嵌入模型的深度推荐算法。