基于大规模知识库的实体描述生成和应用

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:kezhixiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱在工业应用中拥有越来越重要的地位,同时也是人工智能领域重要的基础设施。知识图谱或知识库中拥有大量的事实,主要由数目繁多的实体与它们之间的相互关系所构成。此外,知识图谱一般还会包括针对每个实体的自然语言描述文本,一般是实体的一句话简介。这样的实体描述可以直观地向用户呈现实体的概要信息,从而在工业界中有广泛的应用。本文提出了一种基于已有的大规模知识库自动生成实体描述的方法,主要使用先对知识库进行一定程度的补全,然后使用端到端神经网络模型进行文字的生成,最后演示了在面向最终用户的问答系统中应用实体描述的方法。知识库的补全涉及表示学习的方法,通过学习实体和关系的低维向量表示,实现补全部分缺失实体的效果。以往的方法中主要都是设计判别式的模型,本文提出了在较新的对抗训练框架下结合判别式模型和生成式模型的新方法,使得系统性能在现有的判别式模型基础上获得了进一步的提升。在补全了知识库之后,本文采用编码器解码器框架,提出了一个端到端的神经网络模型。编码器和解码器均为神经网络,解码的过程中还使用了关注机制来建模实体描述的每个词与知识库数据的相关性。通过这个方法即可联合学习实体描述生成中的两个重要步骤,即内容选择和表述具现化。此外,本文主要讨论了知识库上的多跳事实的重要性。为了提升句子的流畅度,这个模型可以编码知识库中的多跳事实,并提升了自动化评价指标。最后,问答系统是知识库的一个典型应用。为了演示实体描述的作用,本文展示了在问答系统中使用实体描述的一种方法。本文设计了一个针对真实场景下的问答系统,其构建方法包括模板匹配和语义解析两大类手段,分别应对不同的用户问句。实体描述可以作为一个排序特征嵌入现成的框架之中,本文设计了一个神经网络的匹配模型,用于建模用户问句和实体描述之间的相似性,从而给出用户问句对于每个实体的一个打分。这个功能最终作为一个微服务,嵌入问答系统中。
其他文献
俄国十月革命后,马克思、列宁主义在中国得到广泛传播。中国知识分子的先进代表李大钊、陈独秀等人接受了马列主义,并把它与中国正在发展的工人运动结合起来。他们在工人中宣
电子商务对人类社会经济产生了重大影响,在创造巨大经济效益的同时,也从根本上改变了整个社会商务活动发展进程。我国电子商务在曲折进程中,已有很大程度的发展。同时,也存在发展
随着全球经济一体化的深入,建筑工程企业与国际市场合作日益频繁。为适应国际市场需要,提高项目管理水平,实施了以“强基固本创新”为载体的系统管理,提高了队伍的凝聚力和向心力
数字信号处理技术是数字化时代的重要技术,其进展一直受到业界的广泛关注。本文对当前的数字信号处理技术进行了简介,重点阐述了数字信号处理技术的创新和发展,并对其前景进行展
路桥过渡段施工是公路工程控制的重点,产生不均匀沉降直接影响到了行车速度,在新形势下提速是大势所趋。所以说对路桥段施工要严格控制,本文通过分析沉降差产生原因,处理方法,以及
文章从智能建筑弱电工程的系统组成、衡量标准出发,结合湖州太湖阳光(雷迪森)度假酒店具体项目,从智能建筑的公共广播系统,有线电视系统CATV和卫星接收系统,电话通讯系统,安保监控系
积极探索和研究电子商务立法问题,加快建立具有中国特色的电子商务法律体系,对推动电子商务的发展具有极其重要的意义。本文拟在对我国电子商务立法现状及存在问题研究的基础上
电子商务的兴起和发展为企业营销带来了新的契机,也向传统营销提出了新的挑战。本文从对电子商务中的消费心理变化趋势、特征及现阶段制约电子商务发展的消费心理因素进行了分