基于Electra-WWM表示的税务问答系统

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:longerken
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
税收是国家组织财政收入的主要形式与工具,税务持续受到社会公民的广泛关注。伴随我国税务信息化建设的全面开展,税务办理效率显著提升,但目前税务存在业务内容复杂、征管关系繁多、时效性较差等问题。纳税人无法全面了解税务政策,税务办理存在的问题主要通过咨询客服专员得以解决,方式单一且人力资源投入较大,无法在较短时间解决大量用户的税务咨询需求。针对当前税务办理存在的问题,论文基于自然语言处理技术与系统开发相关理论,深度融合Electra模型与全词掩码机制(WWM)的优势,构建Electra-WWM复合模型并验证模型效果,以Electra-WWM复合模型为基础设计并实现税务问答系统,论文的主要研究工作如下:1.构建Electra-WWM模型。本文将近期达到SOTA(State-of-the-art)效果的Electra模型与全词掩码机制进行深度融合,根据先验知识构建实体词表和token词表,针对其特性调节损失函数,构建适用于中文环境的Electra-WWM特征表示模型。2.Electra-WWM模型实验与结果分析。为验证Electra-WWM模型有效性,本文利用CLUE2020语料,逐一训练Small、Base、Large三个不同参数规模的模型。实验数据集基于公开数据集CMRC2018、LCQMC、BQ Corpus与自建数据集TQ Corpus,选取F1与Accuracy作为评价指标,与Bert-Base、Ro BERTa-Base-WWM等模型进行对比实验。分析实验结果,与传统Electra模型相比,Electra-WWM在各参数规模上平均有1.5%的提升,解决了中文环境中简写和专有名词理解效果差的问题;与Bert-Base-WWM,Ro BERTa-Base-WWM等模型相比,本模型性能有一定的提升,验证了Elec-tra-WWM模型有效性。3.基于Electra-WWM模型的税务问答系统的设计与实现。论文首先对税务问答系统开展功能性需求分析,提炼税务业务流程、划分税务系统角色,明确系统整体设计原则,对系统的网络拓扑架构、软件层次架构展开设计,将税务问答系统的功能划分为监控统计、知识库管理、账号管理三个模块,设计相关数据库并对系统上线后的前后端界面予以展示。分析上线前测试结果与实际上线后运行结果,该系统能满足一般用户、客服专员与管理人员的业务需求,与同类型现存的智能客服系统相比,本系统的语义理解模型的识别能力强,迭代成本低,并提供贴合业务实际需要的功能模块,能够提高税务问答业务办理效率,优化用户体验。目前,该系统已在大连市、福州市等多地应用,累计创造价值逾百万元。
其他文献
随着用户需求增长,软件开发愈加复杂,设计模式被广泛应用于解决复杂的软件逻辑与结构问题。但软件开发和维护过程中,设计模式作为软件开发中优秀经验的总结,其信息却很难被开发人员直观地提取应用,因此从源码中识别出设计模式的应用实例的方法颇具研究意义。设计模式识别能有效帮助维护人员理解、维护及重构软件程序,也是能实现设计模式可复用性的重要前提。通过总结文献发现,设计模式识别仍有问题有待研究:(1)识别设计模
学位
随着国民经济和对外贸易的快速发展,国际、国内航运事业需求旺盛,中国的航运业已经成为全球市场最具活力、增长力的市场之一。随着航运事业的发展,来往船舶数逐渐增多,航道拥堵问题日益严重,海上交通安全和船舶航行时间长等问题也随之出现。虽然VTS在很多港口已经投入使用并积累了海量的雷达数据,但目前对这些数据的使用却不是很充分,大量的历史数据被遗弃在数据库中,还消耗着存储资源。目前各个港口的VTS基站都只是针
学位
优化问题是一个热门的研究领域。很多现实中复杂的工程和科学问题都可以被抽象为大规模全局优化问题。大规模全局优化问题具有决策变量维度高(一般超过100维)、搜索空间过于广泛以及大量的局部最优性等特点,因此从大量的解决方案中寻找最佳解决方案是研究的重点。进化算法是目前公认的求解大规模全局优化问题的卓有成效的方法。粒子群算法作为一种基于种群协作的全局寻优进化算法,以其实现简单、参数少以及收敛性能好等优点被
学位
现阶段信息数据每天都在以指数级增长,而在海量的信息数据中,文本数据是最为常见的一种。在实际的生活中大部分文本数据集分布都是不平衡的,而原始的文本分类算法大都在平衡的数据集上进行训练,当在实际的数据不平衡的情况下进行应用时,会对模型的分类效果产生较大影响,因此,如何高效的对不平衡文本数据进行分类是一个具有现实意义且急需解决的问题。本文针对不平衡文本数据集(二分类)存在的问题,从类别损失、特征提取两个
学位
近年来我国电子商务发展突飞猛进,网购人数呈指数性增长。随之而来,面对电商平台海量商品信息给网购用户带来的“信息过载”问题,基于用户选择偏好预测的商品推荐系统所蕴含的重要商业价值日益引起社会各界的广泛关注,并逐渐成为这一领域的研究热点。从实践应用来看,亚马逊早在2003年便已投入推荐系统的设计与研发,并在其网站上率先实现了基于协同过滤的商品推荐系统,同时带动了电商平台内推荐系统的广泛应用。从技术角度
学位
日本普惠保险的发展经历了从以保险商品为中心、以区域和行业普及为中心到以业态形成为中心的演变。20世纪初期,日本以简易生命保险产品快速普及普惠保险,配套设置以国家信用为担保的简易生命保险特别规则。20世纪中期,日本以共济业为中心,形成了普惠保险的区域和行业发展模式,共济规制理念和做法经历了以强调个性到注重共性的变迁。1995年放松保险业规制后,日本在立法层面创设小额短期保险业,经由特别立法扶持行业发
期刊
图像作为信息传输的重要载体,保证图像在互联网中安全的传输是一个巨大的挑战。利用混沌特性设计新密码系统,以保证信息的安全存储和传输,是当前混沌密码学面临的迫切任务。本文结合混沌动力系统与布尔网络理论,对混沌图像加密算法设计与模型构建开展了以下研究。(1)结合矩阵半张量积(Semi-tensor Product,STP)理论设计了一种高效的混沌图像加密算法。此方法打破了传统矩阵运算的束缚,使反应矩阵具
学位
财务领域的知识体系复杂庞大,相关政策更新迭代速度频繁,人们日常办理财务业务可能会遇到各种各样的问题,因此需要准确高效的获取财务领域的知识。传统的方式是拨打咨询热线,但当咨询量大、线路繁忙时,用户不能及时的获取知识。随着互联网的快速发展,财务知识的获取大多来源于网络,但财务领域知识具有专业性高、私密性强等特点。用户通过网上搜索的方式难以真正的获取到有效的信息。为解决以上提出的问题,本文结合深度学习、
学位
场景识别是对无结构化数据进行智能处理,从而使其变成可供计算机自动识别的分类问题,是一种综合运用计算机视觉、行为识别和人工智能的重要技术。在大数据和人工智能的时代背景下,场景分类技术广泛应用于遥感图像处理、视频图像处理、智慧城市和智能家居等领域之中。其中,视频场景分类是计算机视觉领域一个热点的研究问题,其目标是综合运用图像处理、机器学习、模式匹配和人工智能等技术实现场景的语义理解,在视频分析、视频剪
学位
在信息数据快速传播的时代,数字图像传输的频率很高。在保护图像信息的各种方法中,对图像进行加密是一种非常有效的措施。与文本和语音相比,图像表示的信息更加生动,但这也意味着图像信息量很大,冗余度很高,相关性很强。因此,传统的加密方案不能保证加密的安全性要求。遗传信息分为脱氧核糖核酸(Deoxyribo Nucleic Acid,DNA)和核糖核酸(Ribonucleic Acid,RNA),DNA计算
学位