融入丰富信息的高性能神经实体链接

来源 :第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 | 被引量 : 0次 | 上传用户:ac8297090
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  歧义的存在使得实体链接任务需要大量信息的支撑。已有研究主要使用两类信息,即实体表述所在文本的信息和外部的知识库信息。但已有研究对信息的使用存在以下两个问题:首先,最新通用知识库规模更大、覆盖面更广,但目前的实体链接模型却未从中受益,其性能没有相应的提升;其次,表述所在的文本信息既包含表述所处的局部上下文信息,也包含文本主题之类的全局信息,文本自身信息的利用率还需进一步提升。针对第一个问题,本文给出了一个融合文本相关度和先验知识的实体候选集抽取策略,提高了对知识库中有效知识的提取;对第二个问题,文本给出了一个融合局部和全局信息的自注意力机制与高速网络相结合的神经网络实体链接框架。在6 个实体链接公开数据集上的对比实验表明了本文提出方案的有效性,在最新的通用知识库上本文给出的实体链接模型取得了目前最好的性能。
其他文献
1编制背景根据住房和城乡建设部发布的《2018年城乡建设统计年鉴》[1],我国城市排水管道长度达到了68.3万公里。但是各个城市普遍存在排水防涝设施现状不清,数据不完整、不准
我国法官选任制度的核心是确保法官群体的专业化和职业化。德国相关制度的设计也围绕这两方面展开。基于这一相似性,本文在对德国法官选任制度进行梳理分析和微观比较的基础
近年来,随着市场环境的变化,制造企业在发展过程中,其产品要想实现其价值和利润,需要与相应的供应链保持密切联系。在这个过程中,制造企业往往处于供应链上游,是产品的直接提
现代社会经济的不断发展使我国人才市场竞争逐渐激化,在大学校园,科学应用微信公众平台开展创新创业教育具有极其重要的现实意义,教育人员必须对其加强重视。文章首先分析创
为了定量分析流域内多种因素对水环境的综合影响,发展并完善了基于动态模拟递推算法和向量模法的水环境承载力计算方法,并将其应用于汉江流域中下游干流供水区水环境承载力分
维吾尔语是一种派生类语言,其词是由词干和词缀连接而成的。其中,词干是有实际意义的词汇单元,词缀提供语法功能。该文提出了基于词干单元和长短期记忆(LSTM)网络的维吾尔语
自动分词作为自然语言处理基础性的研究课题,一直被学术界所关注,随着藏语自然语言处理技术研究的不断深入,藏文分词也面临越来越多的挑战。该文通过分析藏文自动分词研究现
该文针对平坦瑞利衰落信道下的盲粒子滤波检测器存在的样本贫化问题,提出了一种基于进化粒子滤波的盲检测方法。在粒子滤波的重采样阶段,引入进化规化思想,即采用进化粒子滤
基本篇章单元(elementary discourse units,EDU)识别是构建篇章结构的基础,对篇章分析意义重大。从篇章衔接性视角来看,篇章话题结构理论认为,每个EDU都由要表达信息的起始点