基于深度学习的中文机器阅读理解研究及实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:ASD121406113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器阅读理解作为自然语言处理领域的热门研究课题之一,意义在于使机器理解文本语义并具备推理、提炼文本信息并回答相关问题的能力。得益于不断发展的深度学习技术以及大规模机器阅读理解数据集的发布,大量优秀的模型不断被提出和改进,从而推动着机器阅读理解技术的发展和进步。然而现有的大部分机器阅读理解模型仍然具有以下问题:传统的词向量生成技术不能很好地捕获语义信息、效率较低;BiLSTM技术对文章和问题进行编码和建模,在数据量大的任务上不仅时间开销大,而且对距离较长的上下文语义信息不能很好地进行编码;问题和文章的语义信息没有足够的交互融合,使模型无法很好地从文章中找到对回答问题有帮助的部分。基于此,本文基于DuReader2.0数据集,通过改进DuReader基线模型BiDAF的嵌入层、编码层和建模层,构建了一种基于膨胀组合单元和自注意力机制的中文机器阅读理解模型,该模型不仅时间开销小,而且回答问题的准确率较高。本文的主要研究工作如下:第一,改进模型。为了改善现有模型存在的问题,首先使用预训练好的词向量代替随机初始化词向量对问题和文章进行词嵌入,然后使用膨胀组合单元代替BiLSTM分别对问题和文章进行编码,最后使用自注意力机制代替BiLSTM对问题和文章进行语义建模。第二,为了验证改进模型的有效性,本文在大规模中文机器阅读理解数据集DuReader2.0上进行了对比实验。实验结果表明:相比DuReader基线模型BiDAF和Match-LSTM,本文改进模型无论从时间开销,还是从模型回答问题的准确性上来说,都是较优的模型。第三,利用pythonweb技术设计并实现一个基于Web的中文机器阅读理解系统。该系统在改进模型的基础上,秉持高内聚、低耦合的设计原则,采用Django框架分模块进行实现,并从多个角度对其进行了测试。
其他文献
伴随着互联网经济浪潮的到来,我国电商和新零售模式的蓬勃发展,对物流配送服务质量和配送模式需求的增多,导致物流配送市场的需求总量和需求多样性不断增加,给物流配送行业带来了巨大的压力。为了减少人工成本压力以及市场的需求压力,物流业寻求机械自动化、物流智能等方法降低配送成本和提高配送效率。随着无人机行业的成熟,无人机技术逐渐被应用于物流配送过程中。但是对于无人机与物流结合的研究成果较少,而无人机应用于末
我国是自然灾害多发的国家,灾后的应急救援车辆调度问题的研究显得尤为重要。针对强紧迫性和弱紧迫性区域下受灾点需求实时出现的情形,本文探究了考虑快速性和公平性策略的应急车辆实时路径选择问题。强紧迫性区域下快速性策略的目标函数是最小化车辆的服务完成时间及延误成本。在此基础上弱紧迫性区域增加了车辆容量限制的约束,其公平性策略的目标函数考虑到了每一个受灾点的需求量及服务时间。本文主要做了以下两方面的工作:(
中国是电子电器产品的生产和消费大国,电子废弃物环保回收处理面临着越来越严峻的形势。一方面,电子废弃物的产生量逐年增多,年均两位数的增长率。另一方面,电子产品生产者缺乏有效的策略来回收电子废弃物,实现资源最大程度的循环利用。押金返还是有助于生产者承担延伸责任的重要策略,对生产者而言,它可以将消费者的某种行为和权利相结合,比如交回旧产品与取得经济补偿或以优惠价格购买新产品相结合。但是,国内外对于生产者
随着互联网日新月异的发展,人们获取资讯的手段已发生天翻地覆的变化。网络谣言也随着消息的传播在整个社交平台上不断扩散。由于网络谣言存在突发性和短时性的特征,使其影响范围极大,并且使人们陷入恐慌的情绪中。因此,对于网络谣言传播机制的研究成为了学术界研究热点之一。针对谣言传播机理进行量化分析、对影响谣言传播的潜在因素进行挖掘,为舆情部门进行消除谣言、维护社会正常秩序提供了理论支撑。本文从谣言话题宏观多类
目标跟踪是计算机视觉领域的一个重要研究课题,广泛应用在安防监控、军事侦察、人机交互以及自动驾驶等领域。为了减少跟踪丢失的概率,提高目标跟踪的精准度,许多学者对该课题展开了深入研究,使目标跟踪在近年取得了迅速的发展。相关滤波类跟踪算法因其判别能力强和运算速率快的特点而成为了目标跟踪的重要研究方法之一。但受限于复杂跟踪环境下的干扰,相关滤波类跟踪算法在目标尺寸变化、目标遮挡、相似背景干扰以及快速运动等
社交网络平台为用户提供了方便的交流和互动工具,能够即时分享生活中产生的多种多媒体内容。同时,在通信网络和硬件设备不断的发展前提下,社交网络平台也变得越来越庞大。然而,社交网络平台上的大量用户及发布内容的便捷条件吸引了大批网络垃圾用户。虽然国内外研究者提出了许多用于检测垃圾信息及垃圾用户的方法,但是仍存在许多问题,例如建立词库的巨大工作量、基于词的语言特征失效、检测精度及检测效率较低等。为了解决以上
成像器件的动态范围(Dynamic Range)代表了它对场景中的亮暗目标的采集能力,同时受限于硬件条件与制造成本,单次成像能够记录的动态范围远小于人类眼睛,使得照片的观感不尽人意。因此,基于软件的动态范围拓展技术被提出在不显著增加硬件成本的基础上大幅度提升成像质量。如果有效采集场景中的动态信息并将其尽可能多地展示在动态范围受限的显示器上则成为了本领域的研究重点。在过去的数年间有大量相关方法被提出
相似轨迹查询为用户提供了一种有效管理轨迹数据的方法,使得用户可以指定查询区域得到经过该区域的轨迹数据。目前的相似轨迹查询方法往往基于采样位置和采样事件等信息。而在突发社会事件下,用户出行信息往往以文本的形式记录下来。文本不能直接应用于相似轨迹查询,但蕴含了丰富的用户出行位置信息。另一方面,随着互联网的发展,出现了既具有用户出行位置信息,又记录了用户在特定位置进行特定活动的语义轨迹数据。目前许多研究
磁共振成像(Magnetic Resonance Imaging,MRI)技术可以获取到反映人体器官组织多种信息的多模态医学图像,例如:T1加权、T2加权和FLAIR图像等,这些多模态MRI图像被广泛的应用到疾病诊断和临床治疗中。但是,成像原理的限制导致了获取多模态MRI图像需要昂贵的时间成本和经济成本,因此,从已有的MRI图像来准确预测出所需的MRI图像,例如,从已有T1加权图像预测缺失的T2加
近年来,在高压生活以及不规律生活习惯的作用下,心血管疾病致死率高居世界疾病致死榜首,给人类生命健康带来了巨大灾难。心电信号(Electrocardiogram,ECG)作为反映心脏运行状况的体外表征,常常作为心血管疾病诊断的重要依据。随着医疗科技的发展,心电自动诊断系统开始进入公众视野。然而,由于其诊断准确性和实时性不足,心电自动诊断系统却迟迟未得到大规模应用。本文旨在对心电信号分析算法进行研究,