基于机器视觉的工业OCR识别系统的设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:bingqing1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着现代工业生产规模的不断扩大,工业生产已经进入了大数据时代,在日常的工业生产流程中,每一个作业环节都会产生许多需要记录的生产数据值,以此作为衡量产品是否合格的标准。对于许多机器较为陈旧的工厂而言,其设备并不具备相应的数据接口,大多数时候都必须依靠人工识别手动抄录的方式来完成对生产数据的记录,这样高度重复枯燥乏味的工作无疑是对人力资源一种极大的浪费,使得工厂的生产效率大打折扣。为解决这一问题,迫切需要一套能够自主完成对工业信息图像识别的OCR系统。尽管对OCR识别技术的应用已经扩展到了办公、交通、金融等多个领域,但其在工业生产领域的应用还尚不充分。本文针对一类工业信息图像展开研究,结合其特点创新地将OCR识别技术应用到工业生产领域,设计实现了一种针对工业信息图像的OCR自动识别系统,具体工作内容如下:(1)对工业信息图像进行预处理。除了一些基本的预处理操作之外,为进一步获得理想的处理效果,本文还充分考虑到在工业生产环境中可能存在的影响图像质量的因素,对亮度分布不均匀的工业信息图像进行光照补偿改善其灰度分布情况,对角度存在一定倾斜的图像则是基于传统Hough变换的改进方法进行处理,在成功校正倾斜角度的同时缩短了处理时间。(2)通过分析对比工业信息图像和普通文本类图像的不同之处,根据工业信息图像的特点,结合SSD目标检测、色彩空间转换和边缘检测等设计了一种新的方法实现对该类图像信息区域的精准定位和基本识别单元的精确分割。(3)为提高对生产数据识别的准确率,针对不同类型的字符特点采取不同的方法进行识别。对标签文本类字符通过字库的自主训练成功提高了识别准确率,对数字仪表类字符采用不同方法进行测试比较后,最终使用穿线法进行识别,在提高识别准确率的同时进一步减少了识别过程的时间消耗。(4)进行系统测试,从不同的数据集中随机选取相同数量的图片对系统性能进行对比测试,根据测试结果对系统整体性能做出相应评价,改进其中存在的问题和不足之处。
其他文献
近年来随着中国城市化水平的提高,高层建筑的数量也逐日攀升,随之而来的是高层建筑的安全检测以及消防安全问题,如何在火灾现场应对建筑垮塌并确保人身安全,成为了消防从业人员的巨大挑战。现阶段的建筑形变监测手段需要消耗大量人力、物力和时间成本,难以在火灾等恶劣环境中实现可靠的全方位实时建筑健康监测和预警。因此,消防从业人员急需一种工作于恶劣环境下的可靠在线建筑形变监测系统,确保消防抢险人员的人身安全并降低
随着高分辨率雷达的广泛应用,传统的目标检测算法对海面微弱目标的检测存在明显的性能瓶颈。海面上的慢速小目标回波微弱,雷达散射面积太小使得信杂比非常低,传统自适应检测算法很难奏效;复杂的空时变海杂波环境中,高分辨率观测不能满足传统大尺度下的统计特性,很难建立准确的目标模型;在对海观测获取到的大量数据中,目标和杂波的类别非平衡,目标相对海杂波的稀疏性使得海杂波的检测问题在传统的机器学习和模式识别上面临着
随着物联网技术的兴起,人类社会已经进入到一个万物互联的时代,而物联网核心技术则是诸如RFID、UWB等;这些技术同时也深入到了各行各业例如:自动驾驶、智慧货仓、智慧交通、VR体感游戏、导航等;而提供这些服务的前提,就是获取物体准确的位置信息。本文针对上述需求,分析了开源数据集的误差统计特性;其次,指出了经典定位算法模型的不足和局限,提出了一种鲁棒TDOA静态定位算法并讨论了最优基站定位问题和通信距
碳纳米管(cnt)凭借其量子电容特性、高迁移率、截止频率在THz以上的潜能、弹道传输特性,被认为是制造RF晶体管的理想半导体材料,到目前为止,世界各国都致力于高性能cnt FET的研究,然而除了关注于cnt FET本身的直流特性、截止频率、振荡频率外,基于cnt的RF电路芯片验证也是至关重要的,这可以表明其可以代替传统半导体来设计集成电路。本文着重研究了放大器的集成电路,主要的研究方法与成果如下:
随着互联网技术的普及和不断革新,Wi-Fi网络和智能移动终端在人类日常活动中所扮演的角色也越来越重要,同时由于人类的活动大部分都在室内环境下进行,所以人们对基于室内环境的位置服务的需求也不断增大。在室外定位中占据主导地位的卫星导航系统,其信号在穿透建筑的钢筋混凝土墙壁后衰减十分严重,精度也随之衰退到5m至20m,显然这样的定位效果无法满足空间较小的室内环境,因此许多室内定位技术应时而生,而Wi-F
随着量子信息技术的发展,人们逐渐认识到单一量子载体在许多应用场景具有局限性,因此出现了由不同量子载体构成的混合量子系统。以金刚石NV色心为例:NV色心具有很多优点,比如电子自旋态易于读出和操控,室温下相干时间长等,是最受欢迎的固态量子体系之一,在量子计算、精密测量、量子网络等领域具有重要的应用前景;然而,NV色心在原位电学调控方面遇到了挑战,在多比特扩展(即实现芯片上不同色心之间的耦合)方面遇到了
精神分裂症是一种严重的精神疾病,其连接障碍假说提出该疾病与神经元的异常连接有关。静息态功能磁共振成像显示,基于血氧水平依赖信号的自发神经活动在脑区之间相互关联,并组织成空间分离的功能网络,而这些功能网络之间信息交流的异常与精神分裂症中已知的认知功能受损有关。因此,基于磁共振成像的脑网络功能连接分析有潜力揭示精神分裂症的发病机理与指导早期诊断和预防疾病。然而,传统脑网络分析技术仍有亟待解决的科学问题
机器听觉指的是机器通过分析声音信号获取信息的能力。随着智能化时代的到来,机器听觉受到日益广泛的关注。其中一个重要的任务是声音事件识别(Sound Event Recognition,SER)任务。声音事件识别指通过分析音频信号,判断其中的发生的物理事件信息。目前主流的声音事件识别方法是基于深度学习的,但在数据方面存在两个问题:第一,深度学习依赖有标注数据,而声音事件的标注成本很高,难以获得足量有标
近年来,FPGA被广泛用于各个领域,也使得其安全问题变得越来越重要。当前,硬件木马是一种对FPGA有很大威胁的攻击方式,其具备高隐蔽性,强破坏力的特点,在硬件正常工作或者电路出厂测试时都不会被激活,只有在特定条件下才会生效。而其一旦生效,则会破坏用户的电路或者窃取电路中的信息。目前对硬件木马较为有效的检测方式是对网表或RTL代码进行分析,但是对于大部分使用者而言,一般只能接触到比特流文件,想要检测
铁路事业在我国经济建设过程中发挥着重要的作用,传统的货运铁路仍需大量人力资源的投入,而随着计算机视觉的发展,该部分的可优化空间正逐步增加。本文通过针对货运列车定点停车需求的分析,发现该需求可以由计算机视觉中的目标检测技术实现。然而由于实际场景中目标物体会因光照、角度、磨损等因素影响而难以辨认,因此目标检测目前仍是一个颇具有挑战性的任务。而如何设计能够迅速,准确且泛用的特征也成为了该领域的研究重点。