适于移动终端的证件图像检测与文本识别

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:bittermonkey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字是与社会生活息息相关的感知信息来源,相较于观感图像中的其他内容,文字包含着更精简的语义信息。随着5G技术与深度视觉网络的发展与革新,各种新兴人工智能的应用环境与生活交织融合,PC端的自动图像处理系统正逐步向智能终端设备转移,带有文字信息的图像数据资源呈现出爆发式增长,从海量的图像载体中检索目标文本信息成为炙手可热的研究方向,对图像文本信息进行自动识别和提取也具有广泛的商业需求和应用前景,鉴于证件图像作为身份认证、医疗健康、业务办理、人口普查等事务中普遍使用的证据文档,本文研究了一种适于移动终端的证件图像检测与文本识别方法。主要内容包括两部分:(1)证件图像检测与矫正方法。移动端所拍摄的证件图像检测校正往往受背景环境、拍摄角度、相机分辨率以及光线干扰等因素的影响,通常具有成像质量差、文本畸变、不定角度倾斜、文字不清晰等特点,这些特点成为影响系统性能优劣的不确定因素,针对拍摄图像所存在的问题,本文提出了一个简单且鲁棒性强的适于移动终端的证件图像检测与文字识别方法,通过前景分割、轮廓提取、拟合直线、寻求角点、仿射变换一系列图像处理方法提取证件并矫正,测试表明,本方法具有良好的鲁棒性,可确保校正后图像文字不失真、不形变,对后续识别过程的准确率提升效果显著。(2)基于Transformer的证件图像无检测识别。现存的文本识别模型需要依赖检测和识别两个过程,且需借助复杂的网络结构、大量的文本框标注及训练集来提高识别准确率,使得网络模型计算量大、复杂度高,且容易产生累积误差。为了解决以上技术问题,本文在Transformer的模型架构上进行了改进,加入全局上下文模块以及提出可学习的二维位置编码,通过嵌入图像特征图的位置编码,将不同子空间的特征表达直接连接到序列解码器中,本文模型能并行训练并可快速收敛,通过将特殊符号插入到文本标注中,可直接得到结构化的字段数据并自动归档。根据身份证的实验结果,本文的网络模型在性别、民族、出生年月、身份证号码条例上识别率达到了98%以上,且相较于原Transformer基准,姓名和住址条例的识别率达到了86.1%、98.8%,分别提升17.7%、8.5%。本文提出了一个简单且鲁棒性强的适于移动终端的证件图像检测与文字识别方法,通过图像分割与矫正方法提取图像中证件并进行矫正,再对校正后的图像进行文字识别。测试结果表明,本文方法在移动终端拍摄的证件图像识别中表现出优越的性能。
其他文献
纪录片以现实生活为创作主题,以真实的人物和真实的事件为表现对象,对其重新进行主题的艺术创作和艺术提升。纪录片的再现与表现是纪录片创作的重要表现手法。它具有阐释背景、激发情感、放松节奏、营造氛围、时空等功能。它还具有暗示、隐喻、象征、解释和表达等功能。《寻找彭燕郊》这部人物纪录片的主人公是诗人彭燕郊先生,笔者通过“再现”与“表现”的纪录方式,来呈现彭燕郊先生诗歌手稿、书信往来内容和各种珍贵图像视频资
长期以来,县级综合档案馆档案资源开发工作受到档案行政管理体制的限制和传统观念的束缚,未能更好的履行档案馆的公共服务功能,在一定程度上影响了档案价值的实现和档案事业的发展。随着深化党和国家机构改革决定的实行,档案局和档案馆分设后,县级综合档案馆公共文化服务功能逐渐清晰,档案工作可以更灵活有效的开展。互联网和信息技术的发展,使我们进入了信息爆炸时代,不管是档案开发的内容或者是档案利用方式等都发生了深远
高校作为国家培养人才的重要基地,一直以来肩负着为国家和社会培养各类技术型、知识型人才的使命。而高校的人才培养依靠于高校课程教育,需要丰富的课程资源作为支撑。课程资源建设在国内已经开展多年,诸多高校和学者也尝试进行改进,并且有的改革方案取得了一定的成果。比如:一些学校通过MOOC、SPOC的方式去建设一门课程的相应课程资源,通过老师录制教学视频上传至服务器,或者上传一些练习学习的资料至服务器,以供学
目前,随着国家双一流计划的推进,学科建设越来越受到重视。学科是一个高校建设和立足的基础,通过推动各学科的蓬勃发展从而促进我国各高校发展水平的提升。学科服务作为一种服务于学科而出现的深层次服务模式,其以用户的需求为导向,以学科馆员为桥梁,以学科服务平台为载体,以学科资源为依托,通过向不同层次的用户提供专业化、个性化的学科服务,使图书馆能够融入到用户的学习、科研和教学中去。学科服务能够帮助用户解决其在
随着时代的变迁,数据已经成为最重要的资源,得到了全球范围的高度重视,尤其是大数据时代的到来,面对数据爆炸式的增长,如何利用数据为人类带来机遇的同时,也存在数据可靠性低、可靠性差、难以共享等挑战。与此同时,数据往往与人类行为息息相关,如何保护个人的数据隐私也是迫切需要解决的问题。以比特币为代表的区块链技术作为近年来快速发展的新兴技术,具有去中心化、可溯源、高可靠性、防篡改等特性,使区块链在数据保护、
在全面从严治党的时代背景下,明确党内法规的效力既是更好地发挥党内法规制度规范作用的前提,也是有效推进制度治党和依规治党的有效途径。党内法规效力问题是极具中国特色的基础性问题,这一问题事关党内法规的立规质量与执规效果。党的十八届四中全会以来,虽然学界对于党内法规的研究逐步深入,但总体而言,党内法规的基础理论研究仍然存在着不足,对党内法规效力问题缺乏必要的关注。在建党百年之际,厘清党内法规效力的基础理
本文是从生灭过程出发,总结其拟平稳分布(QSD)存在的条件.然后考虑我们所研究的带杀生灭过程{X(t),t ≥ 0},状态空间为S={0}UC,C={1,2,…},利用某种变换,使带杀生灭过程消去杀死率ki,i∈ C,得到只含有出生率bi和死亡率di的生灭过程.再研究这两个过程之间的联系,包括衰减参数的大小关系,转移函数和拟平稳分布之间的关系,将生灭过程的已有相关结论推广到带杀生灭过程之上,从而完
发展先进文化、提升文化软实力是我国面向新时期的伟大决策。提供公平可及的社区图书馆服务是保障公民文化权利,满足公众文化需求、提升国民文化素质、建设精神文明的关键所在。“十四五”规划纲要提出要加快发展健康、养老、托育、文化、旅游、体育、物业等服务业,同时加强公益性、基础性服务业供给,并扩大覆盖全生命周期的各类服务供给。在这样的背景下,公共文化机构的工作重心将从关注服务供给数量,逐步转变为提供公益性、均
本文研究保险公司最优红利策略的估计问题.由于样本量往往是有限的,取值通常在样本空间中是稀疏的.这些稀疏的取值可能会影响估计的精度和稳定性.本文为解决这一问题,受核密度估计思想的启发,在完全离散的复合二项模型中,在随机算子中加入一个随机核,从而构造了一个随机核算子.通过一系列证明得到该算子的唯一不动点是最优策略的一致估计.通过数值实例,我们发现随机核算子方法能有效地改善最优策略和最优值函数的估计效果
环己醇是重要的有机化工中间体。环己烯间接水合法制备环己醇分为两步,首先环己烯与甲酸进行酯化反应,然后生成的甲酸环己酯进行水解得到环己醇和甲酸。此工艺中的关键步骤烯酸酯化反应是典型的酸催化反应,前期的研究工作表明,甲酸会对金属有机骨架类(MOFs)催化剂的结构产生较大的破坏作用,因此本文选用环己甲酸替代甲酸与环己烯进行酯化反应,环己甲酸极性较弱,而且不溶于水,有望保持MOFs结构稳定性的同时,避免了