融合知识图谱的个性化文本推荐方法

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:yinzheng1974
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本推荐中,文本中的关键词在文本集上出现次数较少,导致文本信息的缺失进而影响推荐效果。将这些词语看做知识图谱中的实体,则能够通过知识图谱中对实体的描述解决这类信息缺失问题;而实体链接作为连接结构化的知识图谱信息和无结构化的文本信息的桥梁,能够抽取出文本中的实体并链指到知识图谱上,从而能够基于知识图谱分析文本内容,这将有助于解决文本推荐中低频关键词导致的信息缺失问题。综上所述,本文以知识图谱为中心,以文本推荐为目的,研究基于知识图谱的文本知识分析问题以及基于知识图谱的文本知识利用问题。本文的主要工作如下:1)在文本知识分析方面,本文研究实体链接技术对文本中的实体进行抽取。本文认为实体链接中的实体排歧与实体识别应当协同预测,因此本文首先构建了基于神经网络的实体识别模型;然后构建了基于神经网络的实体排歧模型;最终构建了实体识别与排歧的协同预测模型,减小误差传递,提升实体链接的效果。2)在文本知识的利用方面,本文研究利用文本中的知识图谱信息解决推荐问题。由于文本中关键词的低频特点,基于词语共现的文本建模方法并不能有效的挖掘到这些关键词的信息,进而影响推荐的效果。知识图谱作为文本集以外的知识源,通过将文本中的关键词链接到知识图谱中,能够挖掘关键词的信息。因此,本文在文本推荐中引入知识图谱,从实体的角度出发,通过高斯混合模型对文本主题进行分析,得到基于实体的主题模型;通过矩阵分解的方法对用户行为进行建模,通过翻译模型对知识图谱建模;最终提出了基于用户行为、文本主题分析以及知识图谱表示的协同学习模型。通过实验验证,在实体链接方面,实体识别与排歧的协同预测方法在F1值上相较于两个任务独立预测取得了提升;在文本推荐方面,通过加入知识图谱的信息使得文本推荐在召回率指标上得到了提升。
其他文献
提问作为课堂教学的“催化剂”,它是教师有效教学的方法和要领,是学生展示自我的“舞台”。学生学习历史,并不是简单要求掌握一件事,而是认识这个过程,使其认知能力呈现出由低到高的水平层次,即掌握历史知识和形成历史认识。本项研究以《修订版》的布卢姆教育目标分类学的六个类别:“记忆、理解、运用、分析、评价、创造”为理论视角,对高中历史课堂提问设计进行研究。将两者相结合为历史教学服务,一方面考虑到该理论与课程
在新课程改革的背景下,学生科学探究能力的培养越来越受到重视,提高初中学生解决科学探究题的能力对深化新课程改革有重要的意义。本文主要采用文献研究法和内容分析法对山东省临沂市2010年—2019年近十年中考物理科学探究试题进行研究。首先构建中考物理科学探究试题的分析框架,重点分析中考物理科学探究试题考查科学探究要素的情况、考查《课标》中学生必做实验情况、考查初中物理教科书中“实验探究”内容情况以及科学
近年来,城市轨道交通快速发展,逐渐成为人民日常出行最重要的交通工具,保障直流牵引供电系统的安全可靠运行是城市轨道交通安全稳定畅行的基础,对直流牵引供电系统直流侧结构的分析、短路故障的及时高效可靠的识别以及短路故障发生后的快速定位问题成为我们重要的研究课题。本文重点提出直流牵引供电系统金属性短路时短路故障电流有效辨识方法。针对城市轨道交通直流牵引供电系统定位难的问题,分别提出一种利用故障发生后的暂态
随着电气化铁路向高速和重载化的快速发展,为科研工作者带来了全新的挑战和技术课题。高速铁路牵引网中的导体数目繁多、回流分布复杂,仅通过公式计算与传统的牵引网仿真模型,已不能满足模型精度与高铁进一步发展带来的问题的研究。为搭建更精准的高速铁路牵引网模型,有必要对牵引网模型的简化处理、牵引网电气参数的精确提取以及回流系统的等效计算问题进行研究。本文在既有的研究基础上,计及高速铁路综合接地系统,对高铁牵引
随着移动互联网的发展和社交应用的流行,文本产生的形式逐渐丰富,网络上积累了大量的文本内容之外的信息,比如内容发布者附加的时间、位置以及用户交互产生的点赞、转发等。
与传统的路线固定式公交不同,需求响应式公交(Demand Responsive Connector,简称DRC)没有固定的路线和站点而是按需接客,车辆将旅客运送到共同目的地(例如,地铁或铁路交通网络的换乘站)。旅客选择DRC的意愿会受到票价,旅行时间以及服务时间可靠性的影响。其中,服务时间可靠性的影响非常重要,因为DRC固有的灵活操作意味着行驶时间具有随机性,以往关于DRC的研究往往忽略了这一点。
信息过载已成为当今社会面临的一个严峻问题。推荐系统的出现,在一定程度上缓解了这个问题。时序信息是推荐系统中的一种重要信息。然而,现有的推荐系统算法,或是不考虑时序
随着大数据分析、物联网、移动互联等网络信息技术的快速发展,游客们对于旅游行业的信息化水平要求也越来越高。如何借助信息技术构建信息化公共服务体系,整合各类资源,提高旅游行业的服务水平和品质,对推动和促进旅游目的地信息化服务品质建设和旅游业的可持续发展起到十分重要的作用。本文结合旅游需求理论,公共产品理论、新公共管理等理论,结合旅游信息化相关实践进行分析,分析了信息化公共服务体系的指标基础因子,构建了
视频稳像技术是图像和视频处理领域的热点问题之一。传统的视频稳像方法大多采用后处理的方式,存在较长的延时。然而许多应用场景,如无人机的实时回传视频、手持摄像设备在线
在中国医疗健康服务不断转型的今天,“以患者为中心”的服务理念显得尤为重要。医改政策也在强调改革与改善服务同步,要求各医疗机构积极实施改善医疗服务行动,通过改善诊疗