论文部分内容阅读
网络技术的发展推动了各行业信息化平台的产生,同时大数据和云计算技术的普遍应用使得互联网平台用户及项目数据量急剧增长。推荐系统作为缓解“信息过载”问题的重要工具,帮助用户从海量信息中获取感兴趣的内容,成为互联网应用不可或缺的重要角色。矩阵分解是基于协同过滤推荐的重要方法,其良好的可扩展性及高效性受到业界研究人员的青睐。近年来,深度学习在许多研究领域取得了巨大成功,它在特征表示方面的出色表现对信息检索和推荐系统也产生了重要影响。然而,随着网络用户和项目规模的增加,推荐系统中数据的稀疏性、复杂性以及不确定性等问题对推荐结果的准确性产生了严重影响。本文充分利用深度学习与矩阵分解技术的优势,针对推荐系统所面临的问题,提出了三个解决方案。具体地,本文的主要研究内容和创新成果包括:1)针对数据稀疏性对推荐准确率的影响,本文将深度学习技术与矩阵分解的方法相结合,提出了深度变分矩阵分解推荐算法。该算法设计并训练具有深层变分结构的特征提取网络(semi-VAE)来分别捕获用户和项目隐藏的深层表示;进而,使用具有用户和项目评分偏差的矩阵分解方法来预测评分;最后,提出了优化矩阵分解和变分自编码器联合模型的方法。该算法既充分利用了深度模型在潜在特征提取上的优势,又保留了矩阵分解的可扩展性,实现了深度学习与矩阵分解的紧耦合。2)针对复杂数据中特征融合问题,本文设计了交叉权重网络,并将其应用于因子分解机,提出高阶交叉因子分解机算法。该算法设计了一个深度交叉权重网络用于显式地学习特征的高阶交互。其中,交叉层和压缩层用于学习高阶特征组合权重,权重池化层用以学习不同阶次的特征交互权重,以平衡高阶和低阶交互对算法预测结果的影响。该算法不仅考虑了不同特征组合的权重,还考虑了不同阶次交互的重要性差别,以更好地捕获现实数据固有的相关性;同时,显式的深度交叉操作避免了深度神经网络在学习高阶特征时的不可解释性,且其压缩操作提升了算法的空间效率。3)针对隐式推荐中数据含义存在的不确定性问题,本文从因果关系的角度对缺失数据进行建模,并对影响项目曝光概率的因素进行模糊表示及推理,最后结合矩阵分解进行评分预测,提出了基于因果神经模糊推理的隐式推荐算法。考虑实际应用中,用户看到的项目往往由应用平台推荐,影响了用户接触到的项目。本文分别针对用户及项目的特征,分析影响项目曝光概率的两个主要因素:用户对项目或交互情境的显式偏好及项目流行度。基于二者的模糊性,采用模糊集的理论对这两种因素进行描述,并使用神经模糊网络进行推理,预测指定项目曝光给用户的概率;其中,运用多层感知机学习各条模糊规则的权重。最后,结合矩阵分解算法预测评分,并向用户进行推荐。实验结果表明了深度变分矩阵分解算法设计及优化的合理性,并且在提升推荐准确率上具有一定优势。同时,验证了交叉权重网络的重要性,说明高阶交叉分解机算法在准确率上均优于其他高阶因子分解机推荐算法。此外,基于模糊神经推理的隐式推荐算法与其它有代表性的隐式推荐算法的比较结果说明了该算法的有效性。