基于注意力机制的机器阅读理解技术研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:asnbgq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器阅读理解任务是自然语言处理领域中的一个重要子任务,同时也是自动问答的一个极其重要的支撑技术。机器阅读理解的复杂性,使其被视为评价机器的自然语言理解能力的一个重要方面。随着网络时代迅速发展,大量的自由文本得以在网络上不断积累,如何利用海量的文本资源进行文本阅读,并能够完成更为直接的问答,也是一个具有现实应用价值的课题。得益于深度学习技术的发展以及更具挑战性且贴合实际需求的大型数据集的不断推出,机器阅读理解任务的热度和挑战性不断上升。由于机器阅读理解任务主要解决长篇章的推理回答,而注意力机制可以提供灵活并有效的信息交互与利用的方式,继而成为机器阅读理解任务中不可或缺的一个关键技术模块。因此,对基于注意力机制的机器阅读理解技术进行研究,具有重要的理论价值和广阔的应用前景。本文以机器阅读理解任务中的基于注意力的神经深度模型技术为主要研究对象,开展了各种注意力机制在不同模型架构中的选择应用、不同层次与粒度的注意力关注点、以及不同角度的注意力建模等多方面的研究。论文的主要研究工作如下:首先,对基本模型进行研究分析与探索。介绍了机器阅读理解的任务背景与定义,引入说明本课题中使用的相关技术。然后,研究了基于各种深度神经网络的机器阅读理解模型的构建方法,并且针对深度神经网络的不同编码方式在机器阅读理解任务中的特点,结合多种注意力方式以及辅助手段进行实验对比,从而分析模型中各个关键技术的作用以及不同设计的端到端模型在准确率与时耗上的表现,为机器阅读理解任务的改进与分析奠定基础。然后,在此基础上,对机器阅读理解中的层次信息的联结方法进行研究。不同于以往模型中只在中间部分进行注意力交互,模型将在多处进行不同层别的问题与篇章间的计算,并且将历史信息进行保留,用于后续的注意力模块中,使得模型间能进行层次信息间的交互。在多层之间,使用跨层传递的方式将注意力赋权后的表示进行传递,减少多层传递后的信息丢失。同时,引入了一种门控的方式来有选择性地控制信息的传递。最后,进一步地提出了基于位置注意力机制的机器阅读理解模型,并进行了实验与分析。区别于前面章节的基于语义角度的注意力方式,该模型基于人类阅读理解的回答过程中的先验知识进行设计,使用不同的核函数来刻画机器阅读理解任务中的先验假设,并结合外部知识库来完善位置信息的利用,然后使用注意力机制的方式来进行位置角度的交互。最后,为了对比位置信息的不同引入方式,使用了如位置编码等其他方式进行实验对比验证。实验结果表明,这一先验假设是符合任务背景的,并且使用注意力机制的方式能够使得模型能更好的运用位置信息并帮助回答问题。
其他文献
文献回顾发现几乎所有采用中国样本的心理授权研究中,影响力(心理授权维度)与积极结果变量之间都没有正关联,与西方研究中影响力的积极效用形成了明显对比。结合权力距离理论
小学阶段是学生树立正确人生观、价值观的关键时期,语文教材为学生形成正确世界观、人生观、价值观,形成良好个性和健全人格打下了基础。本文运用文本分析法与统计分析法,对
米兰·昆德拉对人们对于卡夫卡小说的美学价值的误解有着强烈的不满。他认为卡夫卡已经开始实现“梦与现实的融合”。卡夫卡的小说既是对现代世界最清醒的凝视,同时又伴随着
这是一款风靡全球的游戏,并摆脱了手机游戏的普遍命运,历经三年多还让粉丝们为之疯狂,现今每月还有2亿左右的下载量。除了游戏本身,由这款游戏衍生的周边产品有两万多种,并且还在
宋代政治经济的发展,既为科技兴隆提供了物质基础,更为科技的进一步发展提出了迫切的要求。宋朝建国后,历代君主均采取了"重文轻武"的文教政策,逐渐形成了中国封建社会中少见
基于大量语料,从认知隐喻的视角,对比研究味觉词"酸(sour)"在英汉语中语义拓展的异同。研究表明:在隐喻的作用下,它们的语义均由原型义延伸变化,扩展到抽象的情感域,事物特性
从法律的起源与运行方式看民族习惯法的重要作用田成有各民族在长期的生产劳动过程中逐汽渐养成了一些共同的行为模式或行为标准,这种许多人在特定的共同体中通过实践共信共行
普通话儿化词语就目前使用现状来看,存在数量不一致、选词角度各有侧重、所选词语出入很大等问题。这些问题致使学习者在语言表达中不知何时使用儿化词语;在普通话水平测试中
中学语文教学大纲已有百年历史,这百年间,有关部门制定了近20套语文教学大纲及类似文件,这些大纲及文件反映了百年间语文教育发展的脉络,可以帮助语文教育工作者了解当时中学