基于深度学习的候选答案句选择研究

来源 :广东工业大学 | 被引量 : 3次 | 上传用户:XIEJUANJUAN1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统通常由问题分析模块、检索模块、答案抽取和答案选择四个部分组成。答案选择是一个典型问答系统的关键组成部分,答案选择问题可以表述如下:给出问题q和候选答案?a1,a 2,...,as?,我们的目标是找到最佳候选答案ak,其中1?k?s。答案句是具有任意长度的标记序列,并且问题可以对应于多个基本正确的答案句。传统方法在研究答案选择任务的时候通常使用特征工程以及语言工具,对句子分词,句子词性标注、语法分析、句法分析,人工提取文本特征,然后计算答案与问题的语义相似度,并依据相似度进行排序选取出与问题最相似的答案句作为问题的最终答案,这些方法虽然取得了一定的效果,具有这几点不足:(1)人工提取文本特征具有人的主观性,不能很好很全面客观的理解所有的问题;(2)要想获得好的文本特征,就需要人工不断调整特征提取策略;(3)使用特征工程以及语言工具会带来的系统复杂性的影响。相比使用特征工程以及语言工具,深度学习能够主动学习文本中的语义信息,更好的提取文本的特征。本文针对问答系统中答案选择任务提出了一个不需要任何语言工具或外部资源的深度学习框架,首先提出基本模型,长短期记忆网络(LSTM)模型来构建问题和答案的嵌入,在此基础上引入Attention机制,这样能更好的学习问题与答案的特征表示,在本文中我们将该模型称为Attention-biLSTM,该模型仍然具有局限性,因为该模型的注意力每次只能关注嵌入的问题和一个候选答案,不能同时关注所有候选答案以及所有候选答案中的词的信息,针对该问题,本文提出了一种复杂的注意机制来增强这种设计,提出的注意机制增加了候选答案的全局特征表示,结合了答案中所有单词的信息。将答案特定部分的局部信息与整个问题的全局表示相结合。实验分析表明本文的模型优于其他模型,而且改进后Attention-biLSTM模型的实验效果表明明显优于Attention-biLSTM。在使用最大池化的操作下,与基本模型biLSTM相比,Attention-biLSTM与改进的Attention-biLSTM在测试集1上分别提高了5.6%和7.8%,在测试集2上分别提高了4.2%和7%。
其他文献
机器对机器(Machine-to-Machine,M2M)通信在未来物联网的基础设施中扮演着重要角色。随着通信技术的发展,越来越多的机器类设备(Machine Type Device,MTD)需要接入到基站(Base Station,BS)中。由于前导资源受限,当大规模MTD同时请求与BS通信时,现有的随机接入机制会出现接入效率低、时延高、以及资源利用率低等问题。针对上述问题,本文开展了基于分组的
冷战结束后,全球化不断深入发展,国际社会人口的交流与货物的流通越来越频繁,全球经济呈现增长的趋势,各国之间的相互联系不断紧密,相互依赖的程度不变加深。非传统安全的重要性和紧迫性日益突出,公共卫生安全的问题对人类社会的发展产生了深刻的影响,成为人类社会亟待解决的问题。本文首先对于公共卫生和公共卫生安全的概念进行了梳理,由于公共卫生安全与国家利益密切相关,针对公共卫生问题展开国际合作时涉及国际制度,因
现有拥挤频段已无法满足不断增长的高速数据速率业务需求。为了克服频谱拥塞和满足未来业务需求,提出了使用毫米波段的方法。因为现有电子模块和器件频率响应的限制使100GHz
机器人技术近年来得到了广泛的关注和迅速的发展,被应用于工业制造、医疗服务、国防军事等各个方面。随着应用领域的不断拓展,单体机器人在一些场景中无法很好地满足用户的需
通用视频编码(Versatile Video Coding,VVC)作为新一代视频编码标准研究的项目,它与上一代压缩编码标准相比,压缩性能提高了约30%。然而,通用视频编码的高压缩效率是以巨大的
学位
金属激光熔化沉积是采用激光束作为聚焦热能将材料同步熔化沉积的新型加工工艺。但加工过程中存在复杂的多物理场耦合作用,使得沉积质量难以保证。而金属激光熔化沉积质量与
为全面贯彻落实《中国足球改革发展总体方案》,促进中国足球持续健康发展,2017年中国足协制定《中国足球协会2020行动计划》,文件中详细介绍关于足球裁判员培养方案,其中培养
“龙惕”这一概念,源于《周易》乾卦以龙德喻指君子乾乾知惕。季本在此基础上又予以心学阐释,即以龙言心,从而凸显心有主宰且能动的特性。作为阳明后学的季本,担忧心学过于重
电磁场赋形随着微波热疗技术、近场识别技术、物流管理技术等应用的发展正在受到越来越多的关注。随着功率传输最大化方法的提出和完善,我们已经可以对固定发射天线阵列、接