深度卷积神经网络在OCR问题中的应用研究

来源 :电子科技大学 | 被引量 : 29次 | 上传用户:yxiande123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学字符识别(OCR)现在主要应用在文档识别及证件识别。文档识别可以将印刷文档数字化以快速准确提取有效信息,证件识别则是将证件扫描件或复印件数字化,从而提高工作效率及降低工作强度。作为人工智能领域的一个分支,深度学习可以提高OCR的识别的适用范围,应用于OCR的文字区域提取可以增强OCR对文字的提取准确率,提高OCR的准确率。本文通过分析研究OCR的三个关键问题:文字区域检测,字符切割,识别,并分别对三个问题结合深度学习进行优化。先研究三个关键点在实际中可能存在的问题,并结合卷积神经网络的方法进行适当的改进与优化,最终完成基于本文研究方法的OCR识别系统。提出并实现针对证件图像的基于深度卷积神经网络的文本区域提取方法。本文采用基于深度卷积神经网络的方法,使用固定宽度,不同高度的文本序列框对图像进行检测,然后再将文本序列框组合成文本行作为输出。此过程中对于图像中文本区域位置的精确定位及准确定位都是本文中的亮点,另一方面,使用深度卷积神经网络对于文本区域的检测方都在速度都是一个巨大的难题。本文是基于快速区域卷积神经网络的方法,采用其中的一些算法思想,避免了大量的重复卷积计算,兼顾了效率与准确度,使其处理速度能够实现一个实时的证件识别系统。使用针对证件图像文本行图像的二值化方法并提出一种基于神经网络反馈的字符切分方法,对字符切分进行优化。本文通过研究发现字符切割的难点主要在于汉字、英文及数字的混排导致的复杂场景。通过对字符切割方法的研究,使用一种基于神经网络的方法对所提取的文本行基于像素点进行判断而进行二值化,再结合垂直投影方法对字符切分,以提高OCR识别结果的正确率。提出并实现针对证件图像的基于深度卷积神经网络的字符识别模型,并构造针对身份证图像的训练数据集。识别这个关键点的难点在于其类别数量多所导致的识别的准确率问题,本文通过对各种OCR识别的方法进行研究,借鉴各种方法提出一种基于深度卷积网络的识别模型提高其准确率,并结合上下文进行优化。基于上述的各项技术的理论实现一个OCR证件识别系统。系统主要分为文本区域定位,字符切分及识别,通过实验分析,本文区域定位采用的深度卷积神经网络方法可以具有更好的泛化处理能力。
其他文献
本文主要介绍了移动通信技术的多址方式及CDMA的基本原理,描述了CDMA移动通信系统的主要特点。
在分析NAT、防火墙穿越技术的基础上,此文着重分析和讨论了基于H.323协议的语音、视频等媒体流的穿越技术及其实现方法。
目前,“产教融合、校企合作”,进一步完善校企合作育人机制,提高技术技能人才培养质量,是当前推进人力资源供给侧结构性改革的迫切要求。在中等职业教育阶段开展“现代学徒制
为了避免使用用户接收机的初始坐标信息和求导与迭代计算带来的复杂性,研究了一种GPS静态伪距方程的代数解算方法。通过直接求解伪距方程,有效简化了计算,在保证一定精度的前
随着互联网的不断发展,网络已经成为人们共享信息的一个大平台。文献资料数字化技术的出现满足了人们获取信息的需求。将纸制版和图片形式的蒙古文文献资料进行数字化处理有
随着互联网的蓬勃发展,电子邮件成为人们日常交流的重要工具。人们在通过电子邮件接收大量有用信息的同时,也会接收到很多广告、色情、欺诈、木马甚至是反动的内容,这些不良
目的建立小儿感冒颗粒高效液相色谱(HPLC)指纹图谱,为小儿感冒颗粒的质量控制提供参考方法。方法Capcell PAK C 18色谱柱(4.6 mm×250 mm,5μm);流动相:乙腈-0.2%磷酸,梯
随着人工关节置换术的逐渐推广,其术后康复治疗也越来越受到人们的关注.术后康复治疗在维持关节稳定性、恢复关节功能、改善患者生活质量等方面起到重要的作用.就人工关节置
本文结合校园网网络管理的经验,提出了一种新的由一些免费开放软件和一些网络设备上的灵活策略构建校园网安全管理系统平台的案例,并对该平台的几个方面作了详尽的阐述。最后,通
目的:回顾性比较胸腔镜手术入路(VATS组)和胸骨正中入路(TS组)行胸腺扩大切除术治疗重症肌无力(MG)的短期及长期治疗效果,探讨VATS行胸腺扩大切除术治疗重症肌无力的临床价值。方法:共