论文部分内容阅读
个性化推荐因其巨大的商业价值而一直受到人们的广泛关注。随着近年来商品数目的急剧扩大,Top-N推荐以其精准的推送特点,正逐渐成为新的研究热点。深度神经网络能够从用户的历史交互记录中挖掘深层次的行为模式,在相关任务上已经取得了优异的效果。其中,变分自编码器模型在海量数据的排序和推荐上独具优势。然而,现有的Top-N推荐方法在对辅助信息的高效整合与利用上仍有局限性,进而影响推荐服务的质量。针对这一问题,本文以变分自编码器模型为基础,将学习得到信息量更丰富的交互时隐因子表征作为核心思路,从不同角度入手,对信息的有效融合与利用展开了逐步深入研究。本文的主要工作有:1)针对学习层面仅机械拼接与堆叠网络结构无法充分利用辅助信息的问题,本文提出了一种引入属性特征的变分自编码器Top-N推荐模型。该方法将用户属性编码为条件向量,并作为标签验证信号融入学习过程,使得相同属性标签的用户表征具有一定的聚类特性。此外,该方法利用生成式模型的特性进行拓展,通过分离属性予以学习,并集成多个预测池的结果来提出改进。实验结果表明,该方法能利用属性特征捕获用户群体偏好,对比其他未采用标签验证的推荐方法,具有良好的建模表达能力。2)针对特征层面用户行为与不同辅助信息之间的关联程度有所不同的问题,本文提出了一种结合注意力机制的变分自编码器Top-N推荐模型。该方法通过一个子网络捕捉用户表征与辅助信息之间的关系,提高重要属性的融合权重,同时降低无用属性对主网络的影响。此外,该方法尝试于高维嵌入空间构造特征之间的二阶组合,在更细粒度上挖掘辅助信息的提升效果。实验结果表明,该方法能衡量特征关联强弱同时具有一定的可解释性,对比当前应用广泛的相关基线方法,可有效增强模型排序质量。3)针对用户层面仅使用隐式反馈数据未能充分反映用户偏好程度的问题,本文提出了一种融合显式反馈信息的变分自编码器Top-N推荐模型。该方法通过同时进行对显式评分和隐式点击的重构还原,进而将两种反馈信息整合在用户-物品交互的隐因子表征当中。此外,该方法优先挑选出最有可能浏览的物品,并以预测出的评分重新排列先后顺序,对推荐的重排序阶段提出适应性改进。实验结果表明,该方法能够有效汇集反馈信息,对比现有的基于变分自编码器的相关方法,可显著提升最终推荐性能。