基于OCR技术的低对比度下铸件标识字符检测与识别研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:asdf200201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,光学字符识别(Optical character recognition,OCR)技术得到了非常广泛的应用,其相关算法也在字符检测和识别的运用中逐渐成熟。在工业场景下,铸造工件上的标识字符有着举足轻重的作用,通过标识字符可以查询到整个铸造过程中各个环节的详细信息。如果利用OCR技术去自动识别标识字符将大幅减少人们的工作,提高工作效率。但是在背景与字符低对比度的情况下,传统的OCR技术存在抗干扰能力差,识别准确率不高等问题。因此,研究低对比度下铸件标识字符的检测和识别技术,具有重要的实际意义。本文主要工作是基于OCR技术对铸件标识字符进行检测与识别。针对铸造工艺过程中白模挂涂、铸件补漆后标识字符较为模糊,背景和字符对比度低,从而导致检测和识别难度增加的问题,本文通过结合深度学习对此进行研究。具体内容如下:(1)总结了OCR的相关技术和理论。对深度学习理论中神经网络相关技术进行阐述。(2)在字符检测问题上,通过对收集到的真实数据进行灰度化处理,再利用基于连接Proposal网络的文本检测(Connectionist Text Proposal Network,CTPN)算法对铸件标识字符进行检测,经过实验验证,相较于基于滑动窗口的传统检测算法,CTPN在包含铸件标识字符的数据集上F-Score值达到了0.73,很好的完成了低对比度下铸件标识字符检测的任务。最后将检测到字符部分裁剪,便于完成后续的识别任务。(3)在字符识别问题上,使用一种基于卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN)与连接时域分类(Connectionist Temporal Classification,CTC)的端对端光学字符识别模型,该模型在卷积层基于VGGNet16进行了简化和改进,又利用旋转、加噪、调整亮度和对比度的数据增广方法解决了样本数量少的问题,然后根据实验对比选择合适的模型参数,实现了低对比度下铸造工件标识字符的识别。实验结果表明,改进后的字符识别模型稳定、识别率高,对相似字符具有较好的鲁棒性。最终本文结合铸件标识字符检测模块和识别模块,实现了一个完整的OCR模型。在实验的对比中,结合了检测和识别模块的完整OCR模型相较于其他算法,在识别铸造工件标识字符上也有一定的提升,具有较好的性能。
其他文献
综合实验项目涉及多学科知识间融合交叉,可以提升学生的创新能力和综合能力,是理工类高校培养人才的重要手段之一。本文基于综合课程体系要求,针对微控制器技术与直流调速原有实验安排理论知识融合性较差的问题,开发了一套直流脉宽双闭环调速实验系统,并设计了相关实验内容用于教学安排。实验系统由控制器模块、驱动模块、IGBT模块、电源模块、直流电机模块、负载模块、转速检测模块、电流检测模块、上位机模块九部分组成。
自动驾驶技术是当前世界的研究热点,具有深远的应用前景。而轨迹跟踪控制是自动驾驶的核心技术之一,旨在保证跟踪精确性和行驶稳定性的前提下,使自主车辆能够按照参考轨迹行驶。目前国内外对车辆轨迹跟踪进行了大量的研究,并取得了很多研究成果。但是在低附着系数路面等环境下轨迹跟踪的精确性和稳定性有待提高。本文主要研究内容如下:(1)在车辆轨迹跟踪的研究中,本文首先运用了LQR控制理论进行轨迹跟踪。由于LQR理论
在我国社会经济快速发展环境下,高速铁路运输成为非常重要的一种交通方式。随着时间的推移、列车车次的不断增加导致钢轨表面出现了多种病害。钢轨表面病害的出现会降低钢轨的质量和抗腐蚀性能,从而对列车的安全行驶造成威胁。为了提高钢轨表面病害检测分类准确率,降低人工的工作量或者完全得取代人工检测,本文提出了基于深度学习的钢轨表面病害分类技术与研究,将深度学习引入到钢轨表面病害分类的工程应用中。本文主要的研究内
科技发展速度越来越快,机器人所涉及的领域逐渐增多,从简单的物体搬运到复杂的喷涂、点焊等领域。由于人工成本高以及传统焊接效率低,点焊机器人逐渐替代人工劳作,不仅改善了焊接质量,而且提高了焊接效率。与此同时,对点焊机器人的应用提出了更多的要求,包括机器人在焊点间移动过程中,关节运动保持柔顺平滑,末端位置准确无误的到达指定焊点;传统点焊路径规划不合理,路径规划需具备科学理论依据,才能保证点焊路径规划的合
图像语义分割是计算机视觉中的一个重要研究方向,在自动驾驶、无人机及医疗等领域有广泛应用。传统的图像分割只能根据颜色、纹理和形状等底层特征对图像进行分割,能达到的分割精准性有限,无法满足实际需求。而图像语义分割则是在图像分类的基础上将分类对象由图像转变成了像素点。近年来,基于深度学习的交通场景图像语义分割技术成为一个新的研究热点,受到越来越多学者的关注。起初,基于深度学习的图像语义分割多是通过简单地
实际系统中普遍存在着的不确定性与时滞现象,会降低系统性能甚至引起系统不稳定。因此,研究时滞不确定系统稳定性与控制方法具有重要的理论意义和实际价值。滑模变结构控制对外界扰动及系统参数变化表现出较强的鲁棒性,已经在多类系统中得到了验证。本文以滑模控制理论为基础,结合Lyapunov稳定性定理、线性矩阵不等式和自适应理论分析三类不同的时滞系统,并设计具体控制方案。(1)针对时滞系统中存在的参数摄动和不确
随着制播技术的发展,有声语言在视频中的表达方式愈加丰富,视觉化趋势愈加凸显。多屏时代的媒体环境对有声语言传播提出场景化、情感化和话题性的新要求,本文以文化类节目为例,分析有声语言通过声音、图像、文字、视频等元素的多模态表达对节目表现力的提升作用,进一步探讨文化类节目的多平台传播创新。
随着海洋战略的实施,海工装备是实现海洋强国目标的重要环节之一。在海洋环境的影响下,深海起重机起吊点垂直方向的剧烈运动给起重机海上作业造成严重影响,使得钢丝绳或脐带缆断裂。主动升沉补偿可以减弱该影响。本文从深海起重机主动升沉补偿的控制方法入手,实现起重机深海环境下的安全作业。首先,利用海洋波浪动力学和牛顿第二定律搭建深海起重机的传递函数,将传递函数通过系统方框图建立状态空间方程,为互补滑模控制律的设
现如今,工业机器人之所以在各个工业领域随处可见,是因为其具有高效、节能、环保等优势。在机器人研究领域,工业机器人的轨迹规划一直都是研究热点,其目的是在给定约束条件下,在某些特定点之间,寻找一条光滑、省时节能且低残余振动的关节运动曲线,使机器人以高性能完成不同工作任务。本文主要针对六自由度工业机器人从时间和能量两个方面进行研究,主要研究内容如下:(1)使用旋量理论建立了机器人运动学模型,并对机器人正
交通标志中包含了重要的道路指示信息,由于车辆行驶道路复杂、标志种类繁多等原因,使得交通标志检测与识别成为智能交通和无人驾驶研究的热点问题。交通标志牌长期暴露在室外环境下,容易出现受损、被遮挡等情况,从而使得交通标志检测与识别系统效果较差,不能较好地满足驾驶员所需要的辅助驾驶信息。本文在YOLOv4算法与胶囊网络的基础上,实现了交通标志检测与识别,开展了以下工作:(1)针对交通标志检测中小目标检测效