【摘 要】
:
发票是财务人员处理最多的票据之一,但我国多数企业还在使用纸质发票作为交易和财务管理凭证,存在不易保存、查询和管理效率低等问题。随着云计算、大数据、人工智能等信息技术的快速发展,企业拥有了更为先进的技术支持推动财务管理水平的提升和管理模式的创新。目前票据识别系统在金融、税务、车辆管理、保险等票据处理领域得到了广泛的应用,然而市面上出现的票据识别通用性不高,识别精度较低,并且不支持本地部署,使用时需要
论文部分内容阅读
发票是财务人员处理最多的票据之一,但我国多数企业还在使用纸质发票作为交易和财务管理凭证,存在不易保存、查询和管理效率低等问题。随着云计算、大数据、人工智能等信息技术的快速发展,企业拥有了更为先进的技术支持推动财务管理水平的提升和管理模式的创新。目前票据识别系统在金融、税务、车辆管理、保险等票据处理领域得到了广泛的应用,然而市面上出现的票据识别通用性不高,识别精度较低,并且不支持本地部署,使用时需要将数据信息上传云平台,这样对于企业而言,存在泄露公司机密的风险。针对目前发票识别存在的问题,本文进行了基于深度学习和图像处理的发票智能识别算法进行了研究,设计并实现了一套发票自动识别系统。论文具体完成了以下几方面工作:1.发票智能识别算法设计。本文根据发票版面特点以及基于高精度目的设计出一套端到端的发票识别算法。为了提高精度,本文将文本信息看作对象进行发票关键信息识别,以文本检测算法TextBoxes++对发票关键字定位,根据发票关键字和关键识别信息相对位置进行关键字区域扩展得到发票关键识别信息的粗略位置,运用UNET算法分割发票关键信息与背景,以得到发票关键信息的具体位置,再以SSD(Single Shot MultiBox Detector)目标检测算法对关键信息进行识别得到最终结果。本发票识别算法着重分析企业所需,使算法模型在训练过程中着重学习发票关键信息特征,以使算法模型识别关键信息方面达到最优性能。2.发票智能识别系统设计与实现。本系统可以灵活应对企业需求,企业可以根据自身需求选择发票关键信息识别以及训练工具两种功能。本系统设计的发票识别和训练工具提高了框架的通用性和灵活性,不仅可以对发票进行快速精准识别,还可以根据企业需求对合格证、进口证明等其他文件进行生成各种更多文本类别的识别系统,这也是本系统的特色与创新。该系统已经在企业使用,证明本系统能快速准确地识别发票信息,满足了企业发票业务处理需求,通用性好,识别精度高,实现了本地部署,极大地提高了发票处理工作的效率,提高了企业财务管控效率和管理成效。本文研究成果为发票智能识别算法及文本自动识别算法提供了借鉴,设计的系统可在企事业单位进行推广,具有一定的理论意义,同时具有不错的实用价值。
其他文献
微生物岩是一种重要的油气储层。同生-早成岩阶段,微生物岩中有机质的矿化既可以产生酸性流体对碳酸盐颗粒进行溶解,扩大后期成储流体的通道,利于储层的发育;但也可能导致孔隙水处在碱性环境下,形成碳酸盐矿物胶结,阻碍溶蚀流体对储层的改造。因此,有机质矿化过程可能会对微生物岩储层的形成有重要影响,但是目前关于地质历史时期微生物岩中有机质矿化过程及其对储层形成的影响还缺乏实例研究。本次研究选择四川盆地灯影组四
随着化石能源的不断使用,其燃烧后产生的温室气体不断的影响着地球的生态环境,诸如气温上升带来的冰川融化、深林火灾等问题。因此,如何减小CO2的排放成为了当前人们研究的热点之一。同时,中国由于富煤贫油的能源结构,决定了自身需要通过降低对石油的依赖来提高国家能源的战略安全,而我国丰富的页岩气、可燃冰成为了很好的替代能源。基于此,本文通过CO2与甲烷发生重整反应生成合成气,再利用费托合成将合成气转换为液体
近年来,社会快速发展使得个人和企业对金融需求日益增加,而互联网金融服务因能够快速满足用户的金融需求而在国内迅速发展。互联网金融通过对用户信息深度挖掘从而为金融企业提供精准金融服务,降低其金融交易成本,并使得社会金融服务资源配置得到最大化。但同时,由于审核门槛低,信息采集简单等原因,互联网消费金融随之产生了道德风险、逆向选择、个人征信短板、贷前数据维度的采集不足等问题,导致其良好发展势头的背后隐藏了
地震资料去噪和断层解释任务在油气资源勘探与开发过程中扮演着非常重要的角色。传统地震资料随机噪声压制算法存在去噪能力不强,对有效地震信号保护能力差的问题;断层的解释工作存在时间和人力资源成本较大的问题。本文基于深度学习理论,通过构造新型深度神经网络,对地震资料随机噪声压制新方法和断层智能识别新方法进行研究,提高地震资料处理解释能力。其研究成果总结如下:针对基于卷积神经网络的U型网络(Unet)泛化性
随着工业4.0的提出,使得无线网络通信技术和石油领域上带压作业技术的发展迅速,也促进了这两种不同技术的结合。而随着这两种技术的结合,带来的不仅仅是油田的智慧化,也拓宽了无线通信技术的应用领域。在带压作业技术的应用领域上主要存在监控数据多,布线麻烦,数据的实时性不高,人员的安全性和系统的可维护性较低等问题。在使用像WIFI、蓝牙等无线通信技术在石油领域的数据监控上,这些技术主要存在抗干扰性不强,传输
渝东北地区晚奥陶世-早志留世强烈的构造活动导致上奥陶统五峰组-下志留统龙马溪组沉积期沉积环境系统研究相对缺乏。本次论文以渝东北巫溪地区五峰组-龙马溪组底部地层为研究对象,以白鹿、田坝等典型野外露头的详细岩石学及地球化学特征分析为重点,结合巫溪2井、巫浅1等5口测井、钻井资料,对研究区目的层地层和岩石学特征、沉积相特征以及沉积环境岩石地球化学特征展开系统研究,完成沉积环境演化特征分析,并进行页岩气勘
随着互联网的普及,自动文摘技术在新闻标题生成、新闻摘要生成、搜索结果预览等领域得到了广泛的应用。作为自然语言处理的一个重要分支,自动文摘指对指定文档的主要内容和含义进行自动归纳、提炼进而形成摘要。在众多的自动文摘技术中,基于图论的TextRank算法由于不需要深入的语言学知识以及特定范围或特定语言的语料库而备受关注,并得到了广泛应用。另一方面,随着在线媒体的发展,网络新闻已成为人们获取信息的主流媒
随着技术的进步,我国的网络普及率在世界名列前茅。同时人们的思想越来越开放,面对新鲜事物较之过去也更容易接受。网络文学、网络大电影,电子商务、短视频等逐渐流行起来,即有利于我国的经济发展,又丰富了人们的精神生活。但在这信息飞速膨胀的年代,信息的质量参差不齐,人们的兴趣偏好也有很大的差异。如何才能从过载的信息中快速定位到有效信息,成为研究者新的聚焦点。传统搜索引擎的出现有效地缓解了信息飞速增长带来的压
四川盆地中二叠统茅口组白云岩储层具有较大勘探潜力,但因白云岩成因的争议性及缺乏储层差异性对比分析,目前勘探成果与预期尚存差距。鉴于此,论文在前人区域构造-沉积格局研究基础上,通过野外露头实测、普通薄片、铸体薄片、阴极发光及扫描电镜观察,结合岩石地球化学、同位素地球化学及物性分析测试等结果,对比分析了四川盆地东南部及西南部茅口组白云岩的岩石学及地球化学特征差异性。主要取得认识如下:1、四川盆地中二叠
腾冲地块中生代—新生代时期构造活动与岩浆作用活跃,形成大量酸性—基性岩浆岩。通过对这些岩浆岩的研究,可以为认识腾冲地块构造演化的过程提供重要的依据。以往对该地区岩浆岩的研究多集中于广泛出露的花岗岩,并据此对腾冲地块岩浆作用和构造演化提出了相应的认识。但这些认识仍存在很大的争议。研究区花岗岩多显示出岩浆混合作用的特征,但缺少相对应的基性岩证据。本文以腾冲地块卡连地区辉长岩为研究对象,对其开展岩石学、