基于深度学习的问答系统技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:LILLER1010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统是目前自然语言处理领域中的研究热点,它既能让用户通过自然语言直接发问,又能直接向用户返回精确、简洁的答案,而不是一系列相关网页。近年来,深度学习技术为问答系统领域带来诸多突破,基于深度学习技术的问答算法研究成为了自然语言处理最热门的研究方向,诞生了大量优秀的文章与开发框架,如Google在2016年推出的SyntaxNet,大大降低了高性能问答系统的开发成本。本文应用了深度学习技术进行问答系统的构造,开展的工作如下:1.利用词向量与卷积神经网络搭建了一套高准确率的面向具体任务问答系统,改进了已有的卷积神经网络问句分类算法,探索了模型初始化参数与模型性能的关系。2.基于双向长短时记忆模型与注意力机制搭建了一套端到端开放领域问答系统,改进了前人基于单向长短时记忆模型的端到端问答算法在问句语义表征上的缺点。3.在Facebook bAbI、Ubuntu Dialogue Corpus等常用数据集上进行了实验对比,通过实验结果对比突出了本文设计的问答算法的有效性与合理性,并对实验结果做了较为详细的分析。4.利用TensorFlow、Docker构建了一套维护成本低、部署方便的问答系统微服务,解决了 TensorFlow框架线上服务部署困难的问题。本文的主要贡献如下:1.创造性地发现了基于词向量和卷积神经网络的问句语义相似度算法性能与词向量维数之间的关系,并通过实验加以验证。2.尝试了通过复制插值的方式扩展基于词向量和卷积神经网络的问句语义相似度算法中词向量输入部分的维数,解决了问句类别数上升时模型性能下降的问题。3.使用双向长短时记忆模型与注意力机制改进了现有基于循环神经网络的端到端问答算法模型,提高了平均问答长度等性能指标。4.基于TensorFlow与Docker实现了一整套问答系统微服务,创新性地使用Spring Boot包装算法脚本,解决了TensorFlow Serving的兼容性问题,实现了弹性部署与扩容,维护成本低。
其他文献
随着教育信息化的推进,教育资源的全球化、教学的个性化以及学习的自主化成为必然趋势。自2012年起,大规模网络课程(MOOC)在全球呈现燎原之势,但因其存在高成本、高注册率与
随着互联网和网络移动终端设备的日益完善,在国内外相继开展了各种基于互联网的网络教学,尤其是近年来随着MOOC的发展,边疆高校也积极开展网络教学,但存在着一些问题:一是开
充足的睡眠是健康不可或缺的。失眠作为一种身心疾病,对人们的生活、工作等造成不同程度的影响,探讨其病因病机对该病的认识尤为重要。从古至今,中医学对失眠病因病机存在着
<正>"垃圾"是我们每个人生活中难以回避的部分。近些年,随着中国城市化进程的推进,特别是电商经济和共享经济所带动的快递、外卖等上门服务、智慧生活的铺开,"垃圾围城"现象
篮球是高校体育课程中的一个重要项目,受到众多学生的喜爱与追捧,在体育课程选择上,一直以来都是热门。然而,随着教育形势的不断发展变化,高校篮球教学逐渐面临着一些困难,导
市政工程是工程建设领域的重要组成部分,对城市建设的各方面都起到一定的决定作用,其质量与性能对社会生活的影响也较大,因此需要对其质量应严格控制,本文主要叙述了市政工程的因
目的:比较膏肓、关元、三阴交穴的一夫法与骨度分寸法在定位之间的差异,探讨一夫法定位取穴的准确性与实用性。方法:分别记录78名受测者内踝尖至膑尖的长度、脐中至耻骨联合上
如何对企业重组业务进行所得税处理是我们当今面临的问题之一。文章对企业重组方式进行探讨,并分析了新旧政策下企业重组所得税比较和新会计准则下重组业务所得税的特征。
现金是企业生存和发展的血液,而应收账款管理是影响企业的现金流的重要因素。施工企业市场竞争越来越激烈,甚至有时候是恶意竞争,为了保证企业生存和可持续发展,加强企业的应
2014年国家取消了棉花临时收储政策,并在新疆启动实施棉花目标价格试点政策,棉花产业面临政策调整的关键时期。本文分析了这一国家政策的调整对全国棉花生产以及棉业各方的影