【摘 要】
:
机器阅读理解是自然语言处理中十分有价值的研究领域。自预训练语言模型诞生以来,使用预训练语言模型解决机器阅读理解问题以及其他自然语言处理任务已成为一种趋势。但例如BERT模型只允许固定长度的输入,这限制了模型对文本中时序信息的获取和利用。此外,历史问题中的时序信息也不能较好的提取使用。本文的研究工作针对自然语言中的时序信息展开。具体如下:1、针对预训练语言模型BERT在获取较长文档的全局信息存在的限
论文部分内容阅读
机器阅读理解是自然语言处理中十分有价值的研究领域。自预训练语言模型诞生以来,使用预训练语言模型解决机器阅读理解问题以及其他自然语言处理任务已成为一种趋势。但例如BERT模型只允许固定长度的输入,这限制了模型对文本中时序信息的获取和利用。此外,历史问题中的时序信息也不能较好的提取使用。本文的研究工作针对自然语言中的时序信息展开。具体如下:1、针对预训练语言模型BERT在获取较长文档的全局信息存在的限制问题,提出一种基于文本段落时序信息的机器阅读理解方法。首先,该方法使用预训练语言模型BERT获得较为准确的词向量特征表示,而BERT中的位置编码机制有利于获取细粒度的文字时序位置信息;使用时序信息提取模块获取更加丰富的文本时序信息,解决文本段落中的时序信息获取的问题;使用信息交互传递模块进行分段间的时序信息传递,更好的整合使用文本全局信息。2、提出一种基于历史问题时序信息的机器阅读理解模型。除了文章段落,问题中往往也蕴含着时序信息。在对话类阅读理解任务中,模型可以将历史问题的信息融入到当前要回答的问题中。已有工作通过拼接法将历史问题信息融入文本中,这种方法不能有效地进行信息交互。基于历史问题时序信息的模型先通过BERT模型得到历史问题、当前问题和文章的词向量表示,再利用Bi-LSTM_Attention网络对历史问题、当前轮问题和文本进行更深入的交互。由于Bi-LSTM_Attention网络结合了长短时记忆网络与注意力机制的优点,可以过滤掉无关信息、也可以将历史问题中的有用信息整合到当前问题中来,解决了历史问题中的时序信息的过滤与利用的问题。基于文本段落时序信息的阅读理解方法在Co QA数据集上的实验结果显示,与基准的对比模型相比,该模型F1值提高了1.5%。基于历史问题时序信息的机器阅读理解模型实验在两个对话类数据集(Co QA、Qu AC)上进行。实验结果表明模型在获取历史问题时序特征信息的有效性。
其他文献
加快构建现代职业教育体系,要一体化设计中职、高职、本科职业教育培养体系,要求在中高职贯通培养中把创新创业教育落实分解到人才培养方案中,在教学设计、课程建设中要根据三二分段的不同阶段学生特点来分步实施。通过分析现阶段中高职贯通培养中创新创业教育现状,结合职业教育的最新发展要求,探索在优化课程体系建设、加强师资队伍建设、强化创新创业实践、加强理论研究等方面把创新创业教育渗透到人才培养的每个环节中去。
甘南藏族自治州地处“安多藏区”东北边缘地带,东边和汉地相接,素有“汉藏走廊”之称,是河南古道丝绸之路的重要通道,自古被历代王朝视为“内华夏外夷狄”的缓冲地带,是藏族、汉族、回族文化交融的重要地段。甘南传统碉房式民居建筑正是汉藏文化在这一特殊地理区域,经过千百年的碰撞从而形成的,既具有地缘上的边缘性特征,又具有族源上的混融性特征,因此具有不可替代的研究价值和保护价值。近年来,随着甘南地区社会生产力和
动态多目标优化问题往往有多个相互冲突的目标,且约束条件和相关参数等可能会随时间变化。求解动态多目标优化问题时,往往要求算法能够在问题发生变化之前求出其Pareto最优解。研究人员常使用的求解策略有基于多样性的策略、基于记忆的策略和基于预测的策略。然而,这些方法存在一些不足:多样性策略可以保证算法的全局搜索能力,却无法加速种群收敛;记忆策略适用于周期性变化,对于非周期性变化,可能会误导种群的搜索方向
“十四五”时期,我国交通运输基础设施建设的重点即将改变,道路建设的强度将缓慢下降,而养护的需求则逐步上升,开始进入建设与养护并重的阶段。沥青洒布车作为具有代表性的筑养路机械设备,横向洒布均匀性是衡量其洒布质量的重要指标。实际工作中,沥青洒布车在多重因素的共同作用下,沥青的横向均匀洒布很难实现,其主要影响因素便是单个喷嘴的洒布情况。因此研究沥青洒布车喷嘴的工况参数、结构参数对沥青洒布成型的影响规律,
本文研究从实际项目出发,通过对白鹿原水生态中心综合办公楼项目任务的分析,总结项目的两大设计难点:难点一,建筑功能复合化带来的空间组织复杂性和尺度需求多样性。随着综合体建筑日益增多,功能与形态的关系更为复杂,论文引入拓扑学的理论和思维方式进行研究,有助于同步考虑功能组织与建筑形态演化。难点二,场地西南侧景观视线需求与西南方向过强的光热条件产生矛盾。当前建筑表皮的性能优化往往忽略人的观景体验,本研究结
随着石油资源的日益匮乏,新型环境友好型生物纤维材料在牛仔行业的应用越来越广泛,牛仔面料因其色经白纬的特点,纱线的染色是研究的重点。聚乳酸作为可降解无污染的新型生物基纤维,与棉相比,聚乳酸可纺长丝;与涤纶相比,可节省能源,促进其染色后的经纱应用在牛仔面料上有重大意义。本文通过分析聚乳酸分子与靛蓝分子的结构特征,探究了靛蓝还原染料深色上染聚乳酸纱线的最佳染色参数;通过实验分析了靛蓝上染聚乳酸纱线的染色
发展装配式建筑是实现我国建筑业向现代化转型的重要举措,与我国供给侧结构性改革发展战略相契合。EPC模式以其设计采购施工一体化、合同关系简单等优势可充分满足装配式建筑建设集约化、专业化、标准化的建设需求,但传统EPC模式分散式、碎片式的合同管理模式对我国装配式建筑的发展造成了一定的制约,合同主体间利益对抗及过度竞争的情况时有发生,建立一套集成化、整体性的合同管理模式的需求已迫在眉睫。在此背景下,本文
背景肠易激综合症(irritable bowel syndrome,IBS)是一种功能性肠道疾病,其特征是反复出现的腹痛并伴有排便习惯异常或改变,是消化科常见的疾病。无特定的组织学异常和生化异常的证据可解释症状。IBS分为腹泻型IBS(IBS-Diarrhea,IBS-D)、便秘型 IBS(IBS-Constipation,IBS-C)、混合型(IBS-Mixed bowel habits,IBS
引文起飞是文献被广泛采纳的重要信号,引文起飞的分布规律研究对解释引文动态进程具有重要意义,为文献科学评价提供新视角。本研究以中国社会科学引文索引(Chinese Social Sciences Citation Index,CSSCI)数据库1998—2018年的引文数据为研究对象,在对引文起飞识别基础上进行统计分析、对比分析及分布模型拟合,较为全面地揭示了引文起飞分布规律。本研究发现,我国人文社
传统的工业化苯甲醇制苯甲醛工艺污染大、能耗高的问题一直未能解决。目前稳定高效的贵金属催化剂如铂(Pt)、金(Au)又因为成本过高又难以大范围普及。因此以低成本和较好氧化-还原能力的过渡金属氧化物为催化剂,开展分子氧为氧化剂的绿色化路线合成苯甲醛得到人们的广泛关注。为此,本文以MnO2、Co3O4和LaMn1-xCoxO3氧化物催化剂为基础,通过SBA-n(n=3,15,16)模板剂改性、掺杂等方式