散文观点类问题的自动解答方法研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:lionsky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器阅读理解要求机器拥有理解、推断文本能力,依据给定背景材料,回答对应的问题。现有的阅读理解研究大多集中于各大开放域的语料库,背景材料描述简洁直白,问题清晰明了。而散文背景材料语句含蓄优美,含义深刻,问题更加抽象概括,更具有挑战性。本文针对高考散文阅读理解观点类问答题的自动解答方法展开研究,主要研究工作如下:(1)阅读理解观点类问题分析。通过对历年高考语文阅读理解题型进行统计,观察到观点类问题分值比较高。进行进一步实例分析后,本文观察到观点类问题中的背景材料所属的散文体裁语句表达含蓄、有意境,问题表达较抽象、概括性较强,且提问方式多样,经过人工归类,本文将其分为证据类与原因类。另外,为了支撑机器对观点类问题的研究,本文构建了观点类问答题的语料库。(2)基于问题词汇扩展的证据类问题解答方法。由于证据类问题的表达复杂抽象,而背景材料的内容表达丰富且含蓄,导致问题与答案之间出现语义鸿沟。针对该问题,本文提出了基于Multi-HLSTM模型的问题词汇扩展方法。首先将背景材料与问题进行交互注意,同时构建预测原问题和预测问题扩展两个任务,使模型对问题进一步扩展。最后将扩展后的问题与原问题同时应用于问题的答案句抽取中。实验结果显示,问题扩展模型对证据类问题答案句的抽取性能具有一定的提升作用。(3)融合情感特征的原因类问题解答方法。原因类问题的解答需要考虑答案与问题之间的因果逻辑关系。通过分析语料中问题与答案,发现该类问题与答案的情感的表达往往一致。因而,本文构建基于答案与问题句对的方法,帮助原因类问题的解答。该方法提取问题句和答案句的情感特征,将其融入到BERT模型的嵌入层中,帮助单篇阅读材料中“问题句-答案句”句对识别分类。实验结果显示,本文基于问题与答案句对的识别方法,提升了原因类问题答案句的抽取精度。(4)观点类问题解答系统。利用本文提出的基于问题词汇扩展的证据类问题解答方法、融合情感特征的原因类解答方法,构建了高考散文阅读理解观点类问题解答系统,该系统界面简洁,功能模块划分清晰,能够很好的展现本文提出方法的实用性。
其他文献
收入分配不公平会影响经济的发展,经济发展的最终目的应是保证同一社会中的所有成员都有平等地分享经济发展成果的权利与机遇,实现个人和社会的全面发展.现实经济生活中的收
笔者对照1994-20-4“经济特区——厦门”邮票作了实地考察。票图由左下方的白鹭女神、中部的跨海大桥和上部的鹭江道建筑群通过电脑合成制作而成。厦门别称鹭岛,传说这里曾是
生物质是自然界中储存最丰富且廉价的可再生有机碳资源。γ-戊内酯(GVL)作为一种重要的生物质衍生化合物,在燃料、化工、食品等领域具有广阔的应用,是公认的基础化工原料替代品
本文对安徽省高等学校现有科技状况进行了详细的调查和分析,指出了企业和高等学校在科技成果转化工作中存在的一些问题,并提出了一些对策.
以废聚苯乙烯(PS)和丙烯酸及其酯类做单体,采用混合溶剂溶解,用环氧树脂进行改性,非离子和阴离子表面活性剂作混合乳化剂进行乳化聚合,制备环氧树脂改性丙烯酸树脂乳液,以环
目的探讨单次聚焦超声治疗慢性宫颈炎的效果。方法随机选取2009年1月至2013年12月慢性宫颈炎患者共计500例,将其分为对照组和观察组,对照组采用微波治疗,观察组采用聚焦超声
介绍大中型客车涂装打磨工艺中各种常见的工艺及发展动态,并分析各自的优缺点.
我国的技术创新存在着情感误区."追赶"的情绪使人们盲目追求技术的先进性,造成资源浪费和效率低下.情感上的急躁情绪是表层的,它有更为深刻的历史文化渊源.应以恰当的文化定
"民以食为天"的思想,从古至今从未改变过,但是随着社会的不断发展,人们生活水平的不断提高,人们对生活质量的要求越来越高,"食"的内容却不断的发生改变,不仅要求食物有更高的