基于知识图谱的新闻推荐系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展让用户可以在网络平台上快速获取到海量信息,面对如此庞杂的数据量,互联网用户难以从中筛选出感兴趣的信息,使信息利用率大幅下降。推荐算法的出现可以帮助用户实现信息过滤,越来越多的平台将推荐算法应用于系统为用户提供推荐服务,包括网络购物、视频音频以及社交媒体等。新闻是用户获取信息的重要方式,在线新闻平台需要更优的推荐算法提升推荐结果,这样才能增加用户流量,因此新闻推荐也成为研究的热点。新闻标题中含有大量的专业词汇以及知识,这些语义信息在传统的新闻推荐算法中不能被充分提取,推荐效果有限。知识图谱是一种包含大量实体和关系的语义网络,能为新闻推荐工作提供更细粒度的新闻语义信息,让新闻报道中的专业术语得到知识层面的额外辅助。如何在新闻推荐系统中利用知识图谱中的三元组知识学习新闻特征表示,从而提升推荐效果,是学者们一直以来的研究目标。本文针对如何有效利用知识图谱中的实体关系信息,开展基于知识图谱的新闻推荐模型研究,并与web系统开发相结合,设计并实现了基于知识图谱的新闻推荐系统。本文的主要工作内容如下:(1)改进DKN模型的新闻建模。DKN模型在新闻建模时,仅使用新闻词嵌入特征与知识特征融合,忽略了标题中单词上下文对新闻语义的影响,因此本文在得到新闻标题的词嵌入向量后,加入Bi-GRU网络与个性化注意力机制充分提取新闻语义特征,并将其与从知识图谱中得到的实体特征与上下文特征通过多通道卷积神经网络进行融合,得到上下文信息更为完整的新闻特征。(2)改进DKN模型的用户兴趣建模。在用户兴趣建模中,不再单纯使用注意力机制根据候选新闻的权重计算用户兴趣,本文针对用户相邻历史行为间的兴趣相关性,设计使用卷积神经网络从用户历史点击新闻的上下文中有效建模用户短期兴趣;通常情况下,一个用户浏览的新闻与其浏览的其他新闻相互影响,所以提出使用多头自注意力机制捕捉新闻间的关联性建模用户长期兴趣。最后通过在公开新闻数据集上的实验,发现改进后的模型在AUC和F1指标上都有所提升,证明了该模型的有效性。(3)将推荐模型与系统开发相结合。按照软件开发流程,先对本文系统展开需求分析,从系统架构和功能设计两方面明确了开发方向,针对管理员和一般用户分别设计了相应模块为其提供服务,最终使用Vue、Spring Boot、Mybatis等框架开发了一个基于知识图谱的新闻推荐系统。最后通过测试,保证新闻推荐系统的功能可以正常运行。
其他文献
人工智能的快速发展,为人类生存生活带来了巨大的挑战,决策环境也发生了巨大的变化,面对新型决策环境,主要的特点包括信息的不完备、数量巨大、多源异构性以及模糊性,都为准确的决策带来了巨大的挑战。粗糙集与形式概念分析作为一种新的不确定性处理的数学理论,对处理不确定性数据有着天然的优势,本文在粒计算的框架下,把粗糙集、形式概念分析以及扩展的模糊集相结合,针对具有不确定性属性的多属性群决策问题,开展了深入系
学位
自“一带一路”倡议提出以来,陕西省逐步扩大了对外开放和国际合作的空间,对外贸易额以高于全国贸易增速的速度快速增长,在全国的贸易地位不断增强。机电产品作为陕西省对外贸易中规模最大、发展最快的产品,对陕西省的外贸增长做出了巨大贡献。近几年来,由于受到中美贸易摩擦和加征关税的影响,陕西省机电产品的出口贸易受到了一定程度的冲击,凸显出了重点产品出口缺乏增长潜力、企业盈利增长承受压力较大等问题。由此,对陕西
学位
目前,发光二极管(Lighting Emitting Diode)正在凭借寿命长、效率高、颜色多样、绿色环保等优势快速地占据着国内外市场,并逐步地替代了传统的照明方式。针对应用场景的不同,LED需要搭配不同的驱动电源芯片进行使用。如今已经开发出了 LED照明专用的多系列、多规格、多品种的恒流驱动芯片。LED驱动电源技术的发展与突破,对提高照明的可靠性、稳定性、安全性等有着非常重要的意义。本文研究设
学位
地海环境与目标电磁散射问题的研究对于复杂环境中目标的探测与识别具有重要的现实意义和应用前景。在实际情况中,目标所处环境往往是复杂多变的,而不同地海环境都有其独特的散射机理,使得对目标进行散射特性分析时,都必须考虑周围环境对目标的影响。因此,本文基于多层快速多极子方法对沙地环境、近海岸交界分区域复合环境与目标的电磁散射进行了系统地研究,主要研究工作如下:1、介绍了复杂目标模型的建模与网格剖分方法,建
学位
电磁超材料是一类利用人工结构作为功能单元构筑的新型材料,可得到自然材料无法获得的新特性。有限元方法是电磁数值计算中的一种主流全波数值方法,对复杂媒质、精细结构具有较强的处理能力,因此对电磁超材料的分析具有优势。有限元方法的计算精度和效率与吸收边界密切相关,合理的吸收边界选取可以在获取精确计算结果的同时极大地节省计算资源。此外,电磁超材料对不同模式的电磁波具有不同的调控能力,基于此特性,在电磁超材料
学位
电源管理芯片可以将输入的电压进行合理地变换并分配到电子设备中的各个模块,随着电子设备的小型化发展趋势,对电源管理芯片的设计需求也日益复杂。德州仪器(Texas Instruments)和芯源系统(Monolithic Power Systems)等国外公司占据了市场的大部分份额,在这一领域有着广阔的国产代替空间。开关电源芯片的研究与设计,对于提高国产芯片的自用率和自给率具有重要意义。美国德州仪器公
学位
以柔性制造系统、现代计算机系统和网络通讯协议等为代表的诸多系统均可归类为并发系统,该类系统通常由若干松散耦合的子系统构成,子系统之间以共享资源的形式协同执行。在资源受限时,不恰当的资源竞争往往会导致系统出现死锁。死锁不仅会降低生产率,甚至会产生严重的后果,如网络通讯因死锁而产生的大面积瘫痪,柔性制造系统因死锁导致物料损耗,甚至机器的不可逆损坏,进而导致巨大的经济损失。因此,如何合理有效地避免死锁从
学位
热电池是一种由盖体、壳体、保温层、接线柱、激活系统及电堆组成的一次性使用电池。在传统的热电池设计中,不考虑热电池内部的产气情况,使得热电池的实际放电时间与设计时的理论放电时间存在较大差异。因此,本文对热电池保温层中多组分气体输运机制及对热电池放电时间的影响进行了深入研究,主要工作及成果如下:(1)基于纤维材料保温层的微观结构图像,构建了从材料到结构的保温层纤维孔隙结构的参数可控代表性体积单元(RV
学位
多聚焦图像融合是图像融合领域的一个重要分支。光学镜头由于受到景深的限制,拍摄时无法同时聚焦多个目标,导致图像中未被聚焦的目标区域较为模糊。多聚焦图像融合旨在将多幅聚焦区域不同的图像融合成一幅全聚焦的清晰图像,融合后的图像能够更全面准确地描述场景信息,具有十分重要的现实意义和应用价值。本文研究了基于图像自适应变换及D-S证据理论的多聚焦图像融合方法,具体研究内容如下:研究了基于自适应变换的多聚焦图像
学位
数据库是国家重点的“卡脖子“难题之一,也是最为复杂的软件系统之一,其核心技术长期被国外企业和机构垄断,比如Oracle、IBM DB2等。随着云计算的发展和普及,分布式数据库为我国的数据库发展带来了换道超车的机会。在分布式数据库中,时钟机制被用来确定分布式提交事务的时序,是最重要功能模块之一,可避免潜在的事务冲突。自混合逻辑时钟(HLC:Hybrid Logical Clock)机制广泛应用于国内
学位