【摘 要】
:
本文主要讨论中文片段型抽取答案的机器阅读理解任务,根据给定的问题以及相关文本片段以一定的方式抽取答案。机器阅读理解的研究是未来智能问答系统的方向之一,应用面十分广泛,有重要的研究意义。近年来,随着深度学习的发展,基于端到端的阅读理解模型研究已发展到了一定的高度。机器阅读理解模型一般由文本表示层、编码层以及问题与文本交互层、输出层组成,需要从不同方面提取文本的特征信息以便更能理解问题以及相关文本片段
论文部分内容阅读
本文主要讨论中文片段型抽取答案的机器阅读理解任务,根据给定的问题以及相关文本片段以一定的方式抽取答案。机器阅读理解的研究是未来智能问答系统的方向之一,应用面十分广泛,有重要的研究意义。近年来,随着深度学习的发展,基于端到端的阅读理解模型研究已发展到了一定的高度。机器阅读理解模型一般由文本表示层、编码层以及问题与文本交互层、输出层组成,需要从不同方面提取文本的特征信息以便更能理解问题以及相关文本片段的信息。自从预训练语言模型BERT的提出,它在各大自然语言处理任务上的表现效果超过以往的深度学习模型,其中一项任务便是机器阅读理解。基于预训练语言模型BERT的阅读理解模型主要思想是先利用深度学习网络无监督地学习文本表示,再经过微调的方式将其部署在下游的机器阅读理解任务上。本文主要运用了QANet模型以及基于最近提出的预训练语言模型BERT的机器阅读理解模型对三个不同的中文阅读理解数据集Cail 2019、CMRC 2018、DRCD进行实验,对比结果并分析。实验证明基于预训练语言模型BERT的机器阅读理解模型对文本信息的理解能力更强,体现在机器阅读理解评价指标上,准确率EM与F1值远远超过了QANet模型的表现效果,EM值平均提升了15.74%,F1值平均提升9.21%。
其他文献
土壤氮磷流失是造成农业面源污染的主要形式,也是水体富营养化的主要来源。在气候因素和人类不合理利用综合影响下,使得汛期时流域内水土流失严重。水土流失所携带的化肥、养分等营养物质和泥沙成为河道、水库污染主要来源之一。本研究以北京市密云县半城子水库为研究区域,选定玉米地1(梯田措施)、玉米地2(坡耕地)、板栗林(水平条措施)、牧草地(人工种植)、自然植被1(鱼鳞坑措施)、自然植被2(无措施)、裸地等七种
随着数字化时代的来临,文本与数据挖掘在实践中的运用愈加广泛,而对于文本与数据挖掘行为能否纳入合理使用及其构成条件,学界存在不同的观点。文本与数据挖掘是一类自动化技术的总称,其大致包含获取、转换、存储提取、分析输出几个步骤。在使用文本与数据技术的过程中往往会涉及到对大量的素材的复制行为。文本与数据挖掘行为不限于“临时复制”,且版权保护中的“私人复制”概念难以全部囊括该种复制,亟需进行新的研究。以许可
光声成像作为一种新兴的成像技术,其以独特的免标记、高分辨率、高对比度的多尺度成像能力在生物医学成像中日益瞩目。声分辨率光声显微镜作为光声成像的重要分支之一,在其发展的过程中仍然存在着诸多挑战尚未解决,本文进行了如下研究以望能够让其在生物医学成像应用中更加适用:1.本文采用六环菲涅耳超声换能器阵列替代传统单阵元超声换能器的方式去应对声学分辨率光声显微镜成像分辨率与成像景深相互制约的问题。通过对阵列中
具有中国自有知识产权的TD-LTE在4G时代迅猛发展,随着无线网络建设规模的不断扩大,4G网络技术得到普遍应用。4G网络的语音实现相比2G和3G网络更加复杂,而在实际网络建设中,很
煤炭的开采已经引发一系列的生态环境问题,了解矿区植被和土壤的恢复规律以及土壤与植被之间的相互作用关系对矿区生态恢复具有重大意义。因此,本文以抚顺西露天矿区为研究对象,通过对矿区4个端帮和1个对照样地的植物群落以及土壤理化性质的研究,在解释植物群落演替规律和土壤理化性质恢复规律的基础上,采用冗余分析(RDA)和相关性分析,揭示矿区植物群落与土壤因子之间的相关关系,为矿区生态恢复提供参考。主要研究结果
随着媒介生态环境发生巨大变化,当前的中国传统报业集团也遇到了刻不容缓的挑战,例如:纸媒的广告量骤减、盈利模式不清、受众粘度下降,这些都让其举步维艰。为了积极应对挑战
发光金属有机框架材料由于兼具了无机材料和有机材料二者的优势,在照明、显示、传感和光学器件等领域中已经得到广泛的探索和应用。本毕业论文首先合成了一种基于具有AIE效应的四苯乙烯的有机主配体1,1,2,2-四[4-(咪唑-1-基)苯基]乙烯(tipe),并且通过质谱,核磁和荧光等的测试确定了其分子结构。然后利用tipe为主配体通过溶剂热法得到了系列荧光MOFs材料。1、以tipe为主配体,4,4’-H
随着人类社会文明的加快,自然资源的消耗急剧上升。工业化、城市化、农业化的扩大,也正在逐步改变地球的气候和环境。由此带来的能源短缺、水资源污染问题严重威胁着地球生态和人类的生存。寻求可再生能源及环境友好型发展模式成为了全球共识。太阳能驱动水蒸发技术对于解决能源消耗和水资源短缺问题具有巨大潜力。目前,普遍采用由光热转换层和隔热层组成的双层界面型系统作为水处理平台,但在长时间的海水淡化应用过程中,光热转
六盘山是西北地区东部重要的水源涵养林基地,存在丰富的云水资源有待开发。为科学开展人工增雨作业,需对该地区降水云系的微物理结构及其降水形成机制进行深入研究。本文首先根据六盘山区降水日值资料对山区降水的时空分布特征进行了简单统计分析,在此基础上采用中尺度数值模式WRF对2018年07月01-02日、08月21-22日发生在宁夏南部六盘山区的两次典型强降水过程进行了数值模拟。利用模拟结果结合实测资料分析
当前,我国正处在传统农业向现代农业过渡的关键阶段,如何加速农业转型,实现农业现代化,是党和中央在新时代被赋予的新的历史使命。2017年“中央一号文件”就明确提出“农业供给侧结构性改革,加强科技创新驱动,强化农业科技推广力度”,指明了现阶段我国农业发展方向,也为农业试验站基地迎来了更加广阔的前景。农业试验站基地在企业、高校、科研单位的支撑下,得到了快速的发展,但是农业试验站地基地在发展的过程中存在着