神经协同过滤模型的改进及其在推荐系统中的应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:zhanghtlx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,人们能够获取的信息资源的方式越来越多,面对的信息资源日益丰富,“信息过载”问题日益凸显,导致人们在海量的信息资源面前难以选择自己想要的内容。为了解决上述问题,推荐系统应运而生。推荐系统是解决信息过载问题最为有效的方式之一,它主要根据用户对项目的显隐式反馈信息学习用户的偏好,为用户快速定位自身感兴趣的内容。推荐算法是推荐系统的核心,决定推荐性能的好坏。协同过滤算法是推荐领域使用最为广泛的算法,但该算法面临着数据稀疏、冷启动等问题。尽管基于矩阵分解的协同过滤很好地解决了协同过滤算法的数据稀疏问题,但是在用户与项目的向量的内积过程中存在不足,限制了该模型的表达能力。由于传统推荐算法的局限性,研究者们逐渐探索基于神经网络的协同过滤,神经协同过滤算法正是其中的研究成果之一。尽管神经协同过滤模型在性能上要优于传统的推荐模型,但是该模型在辅助信息的使用方面以及信息特征抽取方面存在不足。神经协同过滤模型使用用户与项目历史行为信息,生成嵌入特征,通过多层感知机模拟用户与项目的交互,解决了一些传统的推荐算法的不足。尽管在性能上有所提升,但是该算法使用的特征信息较为单一,只使用了用户与项目的交互信息,而没有使用其他的辅助信息。辅助信息如用户与项目的属性标签信息对提高模型个性化推荐性能以及缓解系统冷启动具有重要作用,若能将这些信息引入至神经协同过滤模型中,则可以使神经协同过滤模型的推荐性能更好、推荐可解释性更强。针对上述不足,本文将用户与项目的属性标签信息引入至神经协同过滤模型中,提出融合多种信息特征的神经协同过滤模型。通过研究发现,神经协同过滤模型融合多种信息特征之后会产生如下不足:模型的参数与收敛时间增加、模型无法很好地挖掘多种信息特征、模型对特征信息视为同等重要,消解部分有价值的信息。针对上述问题,本文对神经协同过滤模型做出进一步改进,提出融合异构信息网络嵌入特征与注意力机制的神经协同过滤模型AHINNCF。本文将用户与项目有效的属性信息统一转换为标签信息形式,通过构建用户与项目及其各自的属性标签信息的异构信息网络,使用基于元路径随机游走的网络表示学习算法metapath2vec进一步挖掘多种属性信息的特征,与神经协同过滤模型相融合,提升模型性能。并在模型中引入注意力机制网络,以解决模型对多种特征视为同等重要,导致有价值的特征信息被消解的问题。本文使用两个公开数据集Movie Lens-1M和Pinterest分别在一般场景、模拟冷启动场景以及收敛速度方面对该模型进行实验。实验结果表明,本文提出的模型AHINNCF要更加优越。在一般场景下,模型AHINNCF的性能平均提升2.5%。在模拟冷启动场景下,模型AHINNCF的性能提升3%-10%。在模型收敛速度方面,模型AHINNCF的收敛速度更快。综上所述,本文提出的模型AHINNCF要优于神经协同过滤模型。最后,本文结合改进的神经协同过滤模型与用户的实际需求设计并开发综合相关在线学习平台课程信息的推荐系统,以缓解因海量课程信息资源给学习者带来的信息过载等相关问题。
其他文献
粒子群算法是由J.Kenned和R.C.Eberhart于1995年提出的一种优化算法,它通过模拟动物种群的行为而设计,其目的是获得最优解。这些群体内部各成员之间通过互相协作的方式去寻找食物,并且群体中的每个成员在搜索过程中都积累一定的经验,粒子群算法就是根据这些个体自身的经验和学习其他成员的经验,来不断的改进搜索方向和搜索进度。粒子群算法具有良好的优化性能,使用简单且应用广泛。美中不足的是,粒子
随着互联网技术的不断发展以及人们生活需求的不断增长,智能网联汽车的概念应运而生。与传统汽车相比,智能网联车的功能更加丰富,需要处理的网络数据量的规模也更加庞大。而传统的车载网络的带宽有限,无法处理大量的网络数据。与传统的车载网络相比,车载以太网具备高带宽、高吞吐量、低成本等优势。目前,许多汽车制造商已逐步应用车载以太网来满足高级驾驶辅助系统应用的运行需求。因此,车载以太网在汽车上的应用前景十分广阔
随着改革开放的脚步不断向前大步迈进深化发展,我国经济发展势头日新月异、迅猛提升,经济的发展紧密了世界各国间的联系,中国逐渐从一个发展中国家向发达国家迈进,物质的供给与物质的储备得到了极大提升,与此同时精神需求日益上涨,文化领域得到了空前的发展,其中电影领域的发展尤为瞩目。中国电影从以往为艺术类电影创作模式转向市场经济化运作模式,发展势头强劲,电影市场的蓬勃发展一方面得益于国家相关部门大力扶持,另一
由于二十一世纪网络的发展与信息量的剧增,各类数据间的关系变得越来越复杂,人们也不得不与大量的数据打交道。因此,当前的世界已经进入了大数据时代。为了能够在杂乱无章的数据海洋中高效的检索和整理出人们所需要的信息,就要对大量的数据进行批量分析和聚类,然后实现对这些不同类型数据的量化处理,并使用某种固定规格的数组或者向量来表示它们,这种表示将会满足后期应用中对数据的统计,检索,推荐以及分类等需求。对这些数
近年来,人们越发看重节能环保,而且随着我国居民汽车保有量的不断提升,国家也出台了一系列政策来对汽车能耗与排放提出了更高的要求。轻量化设计能够有效地实现满足汽车性能要求的同时减少能耗与排放,在实现汽车轻量化的途径中,材料替换是十分有效的方式。钢板弹簧的重量占商用汽车非簧载质量的10%-20%,使用复合材料来将其全部或部分进行替换,一般能够实现至少50%的减重,同时可以进一步改善汽车的行驶性能、减少燃
深度学习在语言翻译,图片识别等领域大力发展,已经在生活中获得大量应用,如机器翻译、人脸识别等。随着5G时代的到来,网速对人的限制越来越小,以及人们产生和发布视频资源的便捷性,都促使视频资源在网络中海量增长。如何利用深度学习算法学习视频信息表达方式和进行网络短视频多模态搜索一直是业界关注的研究领域。与手工制作的动作特征不同,深度学习方法在主动学习图像特征方面表现良好,这为人类动作识别技术提供了一个新
深度神经网络在图像分类任务中取得了不俗的表现,在生产生活场景中有着普遍应用。然而,对抗学习的出现对深度学习模型应用的鲁棒性提出了挑战。对抗学习包括对抗攻击和对抗防御,对抗攻击旨在挖掘人与机器学习模型认知事物的差异,对于图像分类任务来说,即是探索分类模型的决策边界。对抗攻击算法利用这种差异基于干净样本添加对抗扰动构建对抗样本,能够诱导机器学习模型预测错误的结果。由于对抗扰动很微小,人类无法察觉对抗样
随着我国经济金融的高速发展,国内的电子商务迈入迅猛发展的时代,与此同时,物流快递业取得了空前的发展。然而,不断发展的物流行业也给物流的配送方式带来了巨大挑战。设置物流快递代收点是目前族类主要的配送形式之一,尤其是在以年轻人为主体的各大高校。但是,现今的的快递代收点不但种类多、分布散乱,而且要求定点取件过期不候。包裹损坏、快件丢失、个人信息泄露等问题也是经常发生,导致用户对快递末端配送服务的满意度极
5G网络技术和智能设备的飞速发展催生了越来越多高级应用的出现,这些新兴的应用服务往往具有计算密集和延迟敏感等特点,这给计算能力有限的用户设备带来了很大的挑战。计算卸载是解决该挑战的有效方法之一。传统的移动云计算模式是集中式的处理方案,将计算任务卸载至位于网络中心的MCC云服务器上执行,其缺点在于MCC云服务器通常距离用户较远,网络传输延迟大,无法满足应用服务的低延迟要求。移动边缘计算模式允许用户设
汽车制造业和信息科学技术的发展使无人驾驶的落地成为可能,目前世界上很多知名汽车企业已经在无人驾驶上进行了战略布局,近几年无人驾驶技术已经开始实验性落地。环境感知系统是无人驾驶系统中的重要组成部分,它为后续驾驶行为决策提供了判断依据,图像目标检测是感知系统中重要技术之一。近几年基于深度学习的目标检测技术成了研究热门,性能出色的新算法不断涌现,逐步取代传统的检测算法,在实际应用中被广泛采用。基于深度学