基于多特征相关及重启随机游走的实体链接

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:gsoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学技术的迅速发展,导致各类数据爆炸式增长,结构化数据和半结构化数据铺天盖地席卷而来,如何快速准确地理解这些数据的含义变得极其困难。实体链接是将给定文本中的实体引用链接到知识库中正确页面上,从而消除文本中实体提及的歧义,对智能问答、信息抽取、文本翻译等多项应用有重要意义。本文针对现有的实体链接方法,忽略了对实体与实体提及类型相关性的考虑,对候选实体之间的关联语义特征提取不足以及忽略了文档中无歧义实体提及对有歧义实体提及歧义消除的积极影响的问题,本文也采取局部链接方法和联合链接方法实现实体链接,主要包括以下三方面工作:(1)设计实现融合多种特征相似度的局部链接方法LMBOMF。针对现有方法忽略实体与实体提及类型相关性特征考虑的问题,本文提出了补充实体与实体提及类型相似度实现的融合多种特征相关性实现的局部链接方法,首先基于注意力机制获取实体提及上下文中重要词汇,然后基于这些得到的词汇实现候选实体以实体提及之间的主题相似性计算;接着对实体提及上下文进行多种特征提取,将这些特征进行整合,然后将整合后的特征转化为由类型词表示的特征向量,基于此特征向量和候选实体的类型实现候选实体与实体提及之间的类型相似性计算,最后融合候选实体的主题相似性得分、类型相似性得分和先验概率得分得到候选实体的的最终得分。(2)设计实现了基于重启随机游走实现的迭代联合链接方法UNEL。针对之前联合实体链接方法对候选实体之间语义特征提取不足以及忽略了文本中那些无歧义实体和已链接实体提及对于未链接实体提及的积极影响的问题,本文首先基于结构化知识库构建候选实体语义关系图,然后采用基于重启随机游走的迭代消岐方法实现文档中各个实体提及歧义的消除,基于重启随机游走模型来实现不同实体提及对应的候选实体之间的信息交互,每一次迭代都会为当前轮次要消岐的实体提及对应的每个候选实体基于重启随机游走计算一个全局得分,再线性融合其局部得分,综合选出得分最高的那个实体作为当前实体提及对应的正确实体。(3)最后,在本文所使用的几个公开数据集上和联合对局部链接方法消融实验和对比实验验证以上解决方案的有效性。最终证明本文的实体链接方法有良好的链接效果。
其他文献
随着成像光谱技术的出现和不断发展,光学遥感从全色、彩色、多光谱遥感进入到高光谱遥感阶段。高光谱遥感成像可以在空间和光谱上获取丰富的“图谱合一”信息,因其在光谱上独特的“指纹”优势,高光谱在地物识别、环境监测、国防安全以及城市规划等领域都发挥着重要应用。然而,随着光谱分辨率的不断提高,高光谱图像正朝着成百甚至上千个波段发展,使得相邻波段之间具有高度的相关性,极高的光谱分辨率一方面会增加后续数据处理的
学位
由于稀疏表示具有模型简单、计算速度快、对存储容量要求小、对数据的潜在联系有整体性的把握等优势,因此相关研究和应用也愈加广泛。其中,通过在稀疏约束项中使用1-范数及其组合形式来实现不同的稀疏效果是常用的稀疏表示方法之一。大多数情况下,稀疏表示是通过Lasso方法实现的,Lasso是在个体水平对不同的变量进行相同的处理来实现变量选择,这会导致过度压缩绝对值较大的参数并且会忽略数据变量的固有组结构信息。
学位
余华在《文城》中传递出浓厚的传统伦理道德的意味,特别是林祥福对于小美的寻找,其实是可以看作对完整家庭和家庭伦理的追寻。他寻找小美的原因除了爱她之外,更重要的是她给了他一个完整的家庭,后来家也随小美的离去而破碎。在溪镇定居也是因为在溪镇感受到家的温馨,到最后死亡也是为了捍卫心中“家”的完整。因此与其说《文城》讲的是寻妻的故事,不如说是一个寻家的漫长旅程。
期刊
在线新闻服务(如国外的谷歌新闻、微软新闻和国内的今日头条等)已经成为用户获取新闻信息的重要平台。由于每天都会生成各种类型的新闻内容,对用户来说如何从海量的文本中快速找到感兴趣的新闻是一个不小的难题。个性化新闻推荐系统已被广泛应用于各种在线新闻平台,其目标是通过从大量新闻中筛选出用户最有可能感兴趣的文章推荐给用户,从而提高用户阅读体验。目前主流的新闻推荐系统架构通常由召回层和排序层构成,其中召回层使
学位
基于视频的人体动作识别,作为近年来计算机视觉领域中热门的研究课题,被广泛应用于智能安防、智慧医疗、人机交互和视频检索等领域。然而动作的类内差异性和类间相似性增加了动作的识别难度;背景复杂性、视角多样性和光照强弱性也同样影响识别性能。为了改善人体动作的识别性能,本文基于深度学习方法,通过学习动作的时空特征对人体动作识别进行深入研究,主要研究工作如下:1)给出一种基于随机稀疏时间采样方法。大多数人体动
学位
近年来,我国海上活动越来越频繁,航运业蓬勃发展。由于海上通航环境较为复杂,海上交通事故时有发生,这对远洋航行的安全保障提出了更高的要求。目前,红外探测技术因其可昼夜工作、抗干扰能力强的特点成为了海面探测的重要手段。基于红外图像的各类目标检测算法相继被提出。各类算法的性能特点和应用场景各不相同,目前主要依赖定性和定量两种评价方式对目标检测算法的性能进行评价,其中,定性评价方式通过检测结果图像进行对比
学位
产后高热治验1例胡端英陈××,25岁,住院号:38522,1992年11月3日初诊。患者于7大前产1婴儿,生产时行会阴侧切术,失血700ml左右。产后3天后即见寒战发热,无汗出,恶露量中等、色黑,会阴胀痛,大便稍于结。曾用西药氨苄青霉索、安乃近等及酒...
期刊
补中益气汤加减治疗高热1例姚信屏(苏州市吴县红十字医院215007)主题词发热/中医药疗法,补中益气汤/治疗应用患者,女,36岁.患者有系统性红斑狼疮史一年余。因妊娠四个月,持续发热半月,伴全身关节酸疼,面部出现妇形红斑,胸闷气急心宕,恶心呕吐收住人...
期刊
运用文献资料、逻辑分析等方法,探究深化体教融合发展的内在价值,剖析体教融合发展中的短板及成因,并提出应对策略。深化体教融合发展的价值:促进学生身心健康发展、培养竞技体育后备人才、建设一体化赛事体系。发展短板:顶层设计的全面性和持续性亟须加强,两系统赛事体系一体化程度有待提高,体、教两系统人才培养机制创新不足,学校体育资源短缺问题突出。应对策略:完善法制建设,确保政策主客体权责利分明;坚持统筹规划,
期刊
报纸