基于深度学习的税务票据自动识别系统的研究及实现

来源 :中国科学院大学(中国科学院人工智能学院) | 被引量 : 5次 | 上传用户:a361583800
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代工业、商业、日常经济活动的繁荣,促使人们频繁使用发票等税务票据,而常规手动管理税务票据费事费力,随着信息技术的发展,这项工作大多交由计算机完成,而传统的人工手动录入税务票据信息的方式,面对急剧增长的税务票据,无法满足人们的要求,且错误率高、时效性差。因此借助信息化手段,提高税务票据信息处理能力,处理效率,准确率,实现税务票据自动识别是解决问题的有效办法。税务票据识别是字符识别技术的实践与应用。本课题首先整理总结了国内外字符识别技术的现状及研究方法,重点介绍了基于神经网络的深度学习方法。并对税务票据自动识别系统进行需求分析、业务流程、架构设计及实现,提出基于Dense Convolutional Network(DenseNet)加 Bidirectional-LSTM(BLSTM)的税务票据内容识别模型。主要工作内容如下:(1)针对税务票据图像的预处理问题,采用OpenCV对图像进行灰度化处理去除不必要的彩色信息;再采用自适应中值滤波器对图像进行降噪处理去除噪音;采用Radon变化对图像进行倾斜校正;最后对图像进行分割定位以便精确提取所需内容。(2)针对税务票据的内容识别问题,仔细研究卷积神经网络的优缺点,采用DenseNet对预处理后的图像进行内容识别提取,并辅以LSTM(Long Short-Term Memory)生成文本长短句,提高识别准确率。针对DenseNet+BLSTM网络结构进行测试验证,确定税务票据识别模型。(3)研究了税务票据自动识别系统功能和非功能性需求,并以需求分析为准线定义业务流程,进行系统架构和数据库设计及实现,设计测试用例对系统进行测试,验证功能正确性。税务票据自动识别系统采用DenseNet+BLSTM网络结构的税务票据识别模型,去除了传统OCR中字符识别的字符分解和字符分类等繁琐步骤,经过多次试验,在识别精度方面获得了较好的实验结果,在税务票据数据集识别中准确率达到93%以上。
其他文献
江苏省特级教师、教授级中学高级教师李仁甫的新著《你的语文课也可以这样灵动》,最近由江苏人民出版社出版.
我国西北诸盆地以及三峡地区均分布有石膏质岩。随着国家工程建设的大规模投入,在许多工程建设过程中,频频出现遇到石膏质岩的情况,给工程的施工建设带来许多难题。湖北巴东
通过对我国篮球人才培养的分析和研究,发现存在着体教结合没有真正发挥作用;球员选才盲目"大型化";训练缺乏科学、先进的方法及监督;球队战术打法与中国球员的实际情况不符;教
当今音乐文化的总体发展呈现多元化趋势,声乐艺术的发展也是如此。而对中西声乐文化长期以来的摩擦、交流、融合,一直是声乐界普遍关注和现实发展的问题。本文主要以青年歌唱
为推进管理会计知识在中国财务专业人上,特别足注册会计师群体中的普及,提升注册会计师的管理会计综合技能,促进行业结构调整,帮助非审计业务拓展,英国皇家特许管理会计师公会(ClMA
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
随着我国雾霾天气逐渐趋于常态化.各种标榜着对PM2.5有防护作用的口罩纷纷登场,成为人们日常生活中对抗雾霾天的主要“武器”。当市场上大量宣称具有防尘、防霾功能,对可吸入
歌唱是音乐与语言的完美结合。需要掌握科学的声乐发声方法.也需要熟知不同种类语言独有的语音特征。文章通过对比意大利语与德、法、汉语语音特征对声乐发声的影响.探索不同国
随着心理访谈节目的逐渐"走红",节目主持人的语言特点也开始受到大家的广泛关注。一个节目的好坏除了节目内容本身以外还取决于主持人的表现。心理访谈节目主持人的叙事语言
本文建立了罚篮过程中篮球运动的三维数学模型,采用数值模拟方法,得到了使篮球空心入筐的出手仰角、速率、横向角构成的三维参数相空间,并提出了基于参数相空间和篮球运动员