基于BERT和句法规则的问答系统研究与实现

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:a499716595
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
政务服务涉及群众生活的方方面面,相对应的政务网站所包含的审批事项众多,不易查找,群众即使在普遍关注的就业、住房、教育、医疗等领域也较难获得理想的信息和直接的解决方案。如果能通过构建一个依托于政务服务大数据的事项审批快速问答系统,那么政务部门就可以顺应当下精简化、高效化的潮流,与时俱进实现“网上办”、“一次办”的高效办件模式,实现群众少花时间少跑腿,快速了解政府在对应领域的政务服务办件政策、办件材料和办件流程的目的。本文结合政务服务相关办件的数据,研究构建了政务服务自动问答系统。主要工作内容有:1.构建实验所需模型的语料库,确定所采用的语言模型,设计整体软件架构,划分模块简化开发流程。提出基于自注意力机制的短文本分类方法模型(Con-Att-Bi LSTMs),对短文本分类进行研究,最后经过softmax函数使损失率极小化。该实验的目的是为智能问答提供优秀的分类模型,尤其时在Bi LSTM模型的使用和研究上,探索使用更优质分类方法的可行性。2.提出一种基于BERT和句法规则的政务服务自动问答方法。首先收集政务相关的问题与答案,建立政务服务问答知识库;其次利用基于BERT和句法规则的问句相似度计算方法进行相似度计算;最后根据相似度计算的结果对问答系统进行答案索取,对问答的准确率进行评估验证。3.构建知识库。知识库中数据主要来自省政务服务网上公示的办件事项和审批事项。然后对所有数据进行归纳整理,按询问内容、类型、问题答案三元组的形式进行存储,形成35个数据类别。4.利用本文所研究的内容和方法,设计基于BERT和句法规则的问答系统设计方案,并对系统进行实现。
其他文献
法医同一认定是一种法医通过对已知和未知客体的两个或多个特征之间的异同点进行比较和鉴别,推断出所研究客体是否来自同一客体的认识活动。该技术中较常采用的生物特征指标主要有人脸、指纹、掌纹、虹膜、牙齿、颅面形态和DNA等,但是在极端环境中,人脸、指纹、掌纹、虹膜等指标可能会受到诸如火灾、化学腐蚀或外部创伤等环境因素的制约,导致信息缺失,且环境和经济因素也常常限制大规模遇难者DNA的测定。因此,研究一种不
人工智能时代,无人驾驶汽车是汽车工业的研究热点,能大幅提高交通系统的安全性和效率性。在无人驾驶领域,图像信息采集和处理十分关键,直接影响无人驾驶系统对路面信息的判断。因此,图像的质量对无人驾驶汽车而言至关重要,然而其经常会受到天气(如雨、雾天气)等不定因素的影响而大打折扣。近年来,随着深度学习的兴起,智能交通(如机动车窗、监控镜头等)图像处理的重要理论和相关技术的研究成果已收获颇丰,能够较好的去除
近些年来,深度学习发展迅速,研究者开始利用卷积神经网络来进行目标跟踪。另外,随着无人机技术的飞速发展,现有的无人机产品具有操作简便和成本较低等优点,采用无人机进行视频目标跟踪已成为新的研究热点。比如在公共安全监控领域,与固定摄像头监控相比,无人机运动灵活,可以获得更加丰富的目标信息,从而更容易持续地锁定跟踪目标。然而,由于无人机飞行的姿态、飞行速度以及飞行高度的快速变化,在信息采集过程中会出现相机
机车发展至今它已经是现代运输网络和物流网络中必不可少的一环,在世界各国中铁路运输是重要的一环。自从我国开始“一带一路”的国际项目,我国的铁路机车因为其性能优越出口各国。但由于各国的铁路轨距有差别,我国在机车设计时要适应出口国家的标准要求。悬挂系统是机车的必不可缺的组成,它的参数选择是否合理对机车的运行起着重要作用。以往的研究中将机车悬挂系统进行简化研究,如一系悬挂简化为具有较大刚度的一个弹簧、其它
计算机和信息技术的飞速发展促进了三维模型在各个领域(包括制造业、娱乐业,甚至军事等领域)中的广泛应用,因而三维模型的数据安全及版权保护问题也受到了人们更多的关注。为了防止非法用户对三维模型数据的盗用以及对其内容的非法访问,本论文以秘密共享和数字水印技术为基础,深入研究了三维模型的数据特点,提出了基于秘密共享的三维模型共享算法和不可见三维模型盲水印算法,实现了三维模型数据及版权的安全保护。本文的主要
无线传感器网络是一种新型的信息获取和信息处理技术,可广泛应用于环境监测、目标跟踪、信息安全、智能医疗等领域。传感器节点一般通过电池供电,由于电池的能量有限并在恶劣环境下不能够及时更换,所以传感器的能量限制成为传感器网络持续运行的障碍。为了解决能量不足问题,研究人员主要从三个方面研究:一方面是设计低功耗路由协议,另一方面是进行能量收集,还有新兴的一方面是能量补给的充电规划研究。随着无线充电的快速发展
铜合金板带材主要应用于引线框架、通信、电力和电气和电连接器的多个领域。其中薄规格的带材其宽厚比可达46502,由于下游生产对成品铜带的表面质量、带材精度、残余应力以及板形的要求极高,所以对铜带的生产提出了巨大的挑战。目前某厂的成品铜带主要存在边浪、1/4浪、边裂、厚度不均匀以及残余应力大等亟待解决的问题。本文使用该厂六辊UCM轧机辊系参数,应用大型有限元分析软件ABAQUS,采用显示动力学,对六辊
在如今的信息化时代,人们每天获取的信息大都来源于网络,但对用户有用的信息却分散在夹杂着噪声数据的网页中。因此,如何从海量的噪声数据中提取到对用户有用的数据受到更多专家学者的关注。而实体关系抽取任务的目标就是将文本中已经标注的实体进行关系提取,从而获得知识之间的关联。常用的实体关系抽取方法是使用单个神经网络进行特征提取,但该方法只能关注特征信息的某一方面,且性能不太稳定;再者最短依赖路径在实体关系抽
海洋技术研究的重要领域之一是海底勘测技术。目前海底世界观测方法主要分为两种:一种是基于声纳图像的远距离勘测;而另一种是基于海底成像的近距离观察。远距离观察所拍摄的图像分辨率比较低,主要适用于大范围内海底物体的搜索;而海底图像则是图像分辨率高,并且颜色信息丰富和纹理细节清晰,因此海底成像技术逐渐成为海洋研究领域的核心技术。但是近距离观察所拍摄到的图像覆盖范围小,因此需要利用拼接技术将多幅图像拼接后进
矫直机作为工业生产线上的关键性设备,它决定了板材的矫直精度,智能化的矫直工艺模型软件系统是其智能化的核心技术。在板材生产过程中,由于板材的各种原因导致屈服强度等关键参数发生变化,从而导致板材的预报矫直力与实测矫直力误差较大,一般引起误差的原因很多,例如弹性模量、板厚、屈服强度等。本文着重于屈服强度这个关键参数,利用关键参数自适应模型调整屈服强度值,修正矫直工艺,满足了高精度矫直需求。本文针对以上问