论文部分内容阅读
机器阅读理解要求机器拥有理解、推断文本能力,依据给定背景材料,回答对应的问题。现有的阅读理解研究大多集中于各大开放域的语料库,背景材料描述简洁直白,问题清晰明了。而散文背景材料语句含蓄优美,含义深刻,问题更加抽象概括,更具有挑战性。本文针对高考散文阅读理解观点类问答题的自动解答方法展开研究,主要研究工作如下:(1)阅读理解观点类问题分析。通过对历年高考语文阅读理解题型进行统计,观察到观点类问题分值比较高。进行进一步实例分析后,本文观察到观点类问题中的背景材料所属的散文体裁语句表达含蓄、有意境,问题表达较抽象、概括性较强,且提问方式多样,经过人工归类,本文将其分为证据类与原因类。另外,为了支撑机器对观点类问题的研究,本文构建了观点类问答题的语料库。(2)基于问题词汇扩展的证据类问题解答方法。由于证据类问题的表达复杂抽象,而背景材料的内容表达丰富且含蓄,导致问题与答案之间出现语义鸿沟。针对该问题,本文提出了基于Multi-HLSTM模型的问题词汇扩展方法。首先将背景材料与问题进行交互注意,同时构建预测原问题和预测问题扩展两个任务,使模型对问题进一步扩展。最后将扩展后的问题与原问题同时应用于问题的答案句抽取中。实验结果显示,问题扩展模型对证据类问题答案句的抽取性能具有一定的提升作用。(3)融合情感特征的原因类问题解答方法。原因类问题的解答需要考虑答案与问题之间的因果逻辑关系。通过分析语料中问题与答案,发现该类问题与答案的情感的表达往往一致。因而,本文构建基于答案与问题句对的方法,帮助原因类问题的解答。该方法提取问题句和答案句的情感特征,将其融入到BERT模型的嵌入层中,帮助单篇阅读材料中“问题句-答案句”句对识别分类。实验结果显示,本文基于问题与答案句对的识别方法,提升了原因类问题答案句的抽取精度。(4)观点类问题解答系统。利用本文提出的基于问题词汇扩展的证据类问题解答方法、融合情感特征的原因类解答方法,构建了高考散文阅读理解观点类问题解答系统,该系统界面简洁,功能模块划分清晰,能够很好的展现本文提出方法的实用性。