智能问答系统的关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:nmg_zl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,网络巨大的信息承载能力,给人们带来了大数据时代,人们学习与检索信息的方式也随之发生了重大转变。在以往的方式中,人们通常使用百度,谷歌等经典的搜索引擎进行检索信息。但是这种检索方式大多利用关键词检索,返回大量的词汇相关网页,需要进一步进行人工筛选。而人们更希望的方式则是使用自然语言进行提问,机器直接返回简洁的、能理解的答案。自然语言处理是人工智能领域的重要研究方向,词法语法分析等语言学技术,统计学习技术被相继提出,其主要目的就是为了解决人类与机器之间的信息语义鸿沟。问答任务作为自然语言处理的重要课题,一直备受人们的关注。最近,深度学习技术的出现,给自然语言处理研究带来了新的前景。自然语言问答任务的最新研究成果也大多基于神经网络的。根据知识源的不同,问答系统可以分为基于纯文本的问答任务与基于知识图谱的问答任务两种方式,本文将分别展开研究。针对纯文本问答任务,本文提出了基于信息丢弃机制的局部推理模型。在纯文本问答中,由于文本上下文很长,包含线索与证据数量较多。通过对数据集的研究可以发现,并不是所有的线索信息都可以对提取答案起正面作用,一些多余的信息可能会干扰最后的信息推理。而以往的模型通常将全部的文本信息进行融合处理,从而可能导致错误。本文提出的语义信息丢弃机制,可以筛选出有效的语义向量,丢弃与问题关联度较小的干扰信息。这种局部推理模型可以有效提升预测答案的准确率,在开放式问答数据集上的结果证明,该模型均优于基准模型。知识图谱问答任务的特点是,知识资源结构化明显,信息证据简单,通常都是由一些简单问句进行提问的。我们通过一种流水线的方式进行处理,选出问题的主语实体和谓语关系,然后通过信息整合方式选出最有可能的答案实体。本文主要针对其中的关系抽取任务进行改进。我们发现在以往的信息处理模型中,神经模型通常只利用问题语句进行关系分类。但这种问题句往往缺乏上下文,很难充分利用神经网络的计算能力。为了解决这个问题,本文利用语句主题词和实体背景信息作为辅助推理信息,使得问题获得充分的上下文背景。我们利用两种注意力机制模型,将辅助信息与问题进行语义匹配融合。在数据集上的实验结果证明,我们的模型可以有效提升关系抽取准确率,有效并提升最终问答的准确率。
其他文献
水力压裂微地震监测是在地下岩石断裂或地层错动而产生的声发射现象的基础上建立的一门学科。随着微地震定位算法的不断提出与改进,微地震监测技术得以快速发展、成熟。目前
Ti3SiC2陶瓷具有良好的热性能、高强度、低密度易于加工等优点,从而得到了许多学者的广泛关注。但是由于Ti3SiC2陶瓷材料具有脆性、难以制备大尺构件的问题,极大的限制了它的
霉心病是苹果生长过程中多见的病害之一,其在果树生长初期、成熟期和贮藏期分别会导致果树落果、果实品质下降和果实腐烂,甚至还会引起相邻的健康果实病变等一系列现象,不仅
随着人们逐渐意识到环境问题的严重性,各国政府开始不断加强环境规制来约束企业的污染行为以保护环境。环境规制在起到保护环境作用的同时,会对经济发展、产业绩效等产生影响
随着计算机技术的进步,软件工程蓬勃发展,软件开发规模越来越庞大,结构越来越复杂,软件中漏洞的数量也日益增加。同时,漏洞的危险性也在逐渐提高,并且绝大部分漏洞是可以被黑
轮胎是现代社会生活所必不可少的一种工具,其结构复杂,各类组成部件的生产工艺繁琐,且生产过程自动化程度相对低。随着人工成本的增加及轮胎企业竞争形势的加剧,各大厂商均在
在全面完善地面数字电视覆盖网、彻底完成地面电视模拟化向数字化过渡的攻坚时期,数字电视发射系统应覆盖更广的范围、占用更小的空间资源、承载更多的频道数。天线是数字电
近年来,随着信息系统不断发展以及业务流程智能化的普及,信息系统被广泛应用到业务流程中。但是,业务流程逐渐便利化的同时也受到信息系统安全性带来的影响。目前关于系统安
资源既是经济社会发展的基础,同时也是制约经济社会发展的主要因素。随着我国经济的迅速发展,对矿物资源的过度消耗也在不断加剧,造成了高品位矿石迅速减少。而我国又蕴含了
近年来,随着各类智能移动设备的广泛普及,社交网络、网上购物、移动支付、位置服务等新兴应用不断涌现,各类海量大数据被采集和处理,而面向这些大数据的挖掘分析服务已俨然成