基于卷积神经网络的名片识别研究

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:sunboy0214
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学字符识别(OCR)目前在证件识别以及文档识别上有广泛的应用,通过将文字的图片数字化,从中快速提取出有用信息。传统的光学字符识别算法大多依赖于人工设计特征,通过模板匹配的方法实现特定场景的识别,因此,适用场景比较单一,泛化能力较差,处理名片识别的任务时效果不佳。此外,在处理文字间存在噪声干扰的图像上,传统的卷积递归神经网络(CRNN)的检测效果也不理想。因此针对上述问题,文本重点研究了基于深度学习的OCR名片识别从而弥补传统识别系统的不足。本文从信息提取的角度出发,利用OCR技术识别名片信息,进而将名片信息电子化,实现名片数据的结构化存储。基于传统方法以及当今主流方法的分析,文本进行了适当的改进与优化,实现了一种全新的基于卷积神经网络的OCR识别系统。在图像预处理方面,本文设计了一套针对于名片图像的预处理流程,如边缘检测,倾斜矫正等,以消除图片干扰因素的影响,并且,针对相机抖动造成的图像模糊情况,本文提出并实现了一种基于编码器/解码器网络的去模糊模型,以提高后续字符识别的效果;在文本区域检测方面,本文提出并实现了针对名片识别的文本区域检测方法,基于YOLO网络,使用固定宽度的文本图像,最终检测准确率提高了0.6%;在文本识别方面,为提高中英文混排情况下的识别率,进行了针对性的训练,使文本识别的准确率提高了1.6%。最后,在系统实现上,设计了系统的人机交互模式,采用B/S架构,在前端Web服务器上采用了高效的Flask框架。在后台服务器上,将OCR的各流程进行了模块化的设计,最终返回结构化的输出结果。
其他文献
目的探讨光学相干断层扫描(OCT)联合间接检眼镜检查对白内障患者进行术前眼底评估的优势。方法通过OCT对黄斑区进行扫描,再联合间接检眼镜检查对年龄相关性白内障患者进行术前眼
目的:探讨PBL教学模式联合糖尿病看图对话工具在内分泌科实习护生临床教学的应用效果。方法采取便利取样法选取2018年1-6月的在内分泌科实习的40名护生为对照组,选取2019年1-
针对英语阅读课存在的问题,提出了改革英语阅读课的方法.系统地帮助学生掌握阅读技巧,提高学生的阅读理解力和综合应用英语的能力.
从氏族部落,到农耕田舍,到城邦生活,再到现代社会,人类生存干地球,却生活于社区。美好的生活,源于美好的社区,改变社区是改变人们生活的最佳路径,家园永远是幸福的中心。
[目的]探讨鼻咽癌同步放化疗病人述情障碍状况及其与病耻感的相关性,并分析其影响因素。[方法]采用病人一般资料调查表、社会影响量表、多伦多述情障碍量表对204例鼻咽癌同步
北安地区位于松辽盆地内的东北部,共有姚家组顶界、泉头组顶界、营城组顶界、基岩顶界四个主要地震反射层位,缺失登娄库组反射层.北安断陷期地层反射能量均较弱,且基本为中低频反射.北安断陷是北安地区最重要的一个断陷,北安断陷西侧发育有北安西断裂,走向北北东,在平面展布上近"S"型,主要发育于侏罗系地层;北安断陷东侧发育有北安东断裂,走向北北东,其特点是上逆下正,从姚家组断至侏罗系地层.北安地区发育有较大的
随着矿产资源需求的不断加大,我国西部高山区利用高精度航磁技术开展矿产勘查的需求越来越高,本文以东昆仑、阿尔金等多个高山区实测资料为基础,通过对不同型号飞机性能进行对比
[目的]探讨并尝试构建脑卒中健康管理师岗位管理方案,为脑卒中健康管理师规划职业发展路径提供参考。[方法]在文献研究、专科试点和焦点问题访谈的基础上,采用德尔菲法对12名
2019年,喜迎新中国成立七十周年。这不平凡的七十年,新中国创造了一个又一个奇迹,从一穷二白,百废待兴,到百姓安居,国富民强,人民生活得到持续改善,经济总量更跃居世界第二;
房屋建筑是维持人类生存的基本条件之一,也是生产生活的主要场所。大型房屋建筑具有超大型的建筑面积、复杂的建筑工序、先进的建筑技术等共同特征,这些特征不仅反映了当时的手工业水平、资源利用能力,也反映了当时的社会组织结构。东北地区作为一个相对封闭的地理单元,在考古学文化上具有很多共同特征,其中大型房址数量多、面积大是东北地区新石器时代考古学文化的显著特征。本文主要研究内容可分为两部分,第一部分为运用类型