大输液瓶外观灯检算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:barbaraxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在医疗输液制剂生产行业,由于自动化灌装技术的应用,输液灌装制剂的年生产量极大。而对产品质量的检测环节还处于人工视觉检测的阶段,大大限制了生产效率。本课题通过使用以深度学习算法为主的机器视觉技术,设计输液瓶标签文本检测系统,来代替人工检测,提高生产效率。本课题以工业医疗输液瓶生产环境为研究背景,围绕输液瓶外观标签的文本检测与识别方法展开研究,以深度学习技术为核心,在前人的研究基础上拓展,设计了大输液外观文本检测系统。课题对系统需求及组成进行了介绍,并对系统的稳定性及实时性进行了验证。针对标签文本倾斜的问题,本课题设计了基于傅里叶变换与霍夫变换的文本校正方法。通过对输入进行傅里叶变换的方式,对图像在频域进行角度检测以及旋转校正。最后对方法进行了实验,并对方法在检测准确度和检测时间两方面进行评估。针对文本检测的需求,设计了卷积神经网络与递归神经网络联合训练的网络结构。通过卷积神经网络与递归神经网络构成联合网络的形式,有效利用图像中文本区域的上下文信息,降低了文本区域误检和漏检;本文还设计了细致尺度文本区域的方法,提高了文本区域水平检测的精度;本文还设计了在网络中加入可训练参数对预测的文本框进行边缘细化的方法,进一步提高与标签真值区域的拟合程度。针对文本识别的需求,设计了基于联结时序分类的文本识别网络。本课题首先使用基于联结时序分类的递归神经网络结构与卷积神经网络联合训练,避免了对文本的预分割和后处理的操作。然后通过数据集的扩充,提高了网络的整体效果。本文为测试系统是否满足工业需求,首先对各个模块单独进行实验,再对系统整体进行联合实验,虽然整体实验结果与单独测试相比有所下降,但单个模块的效果非常理想,这证明了所设计系统的有效性,具有改进的潜力。
其他文献
图是一种表达能力很强的数据结构,它可以表示现实世界中对象和对象之间的关系,如城市与城市间的道路连接、人之间的血缘关系。许多问题都可以用图表示再通过图算法解决。图和
随着科学研究和商业应用的发展,人工智能技术已在医疗、交通、安防、互联网金融等诸多领域得到广泛应用。生物特征识别作为人工智能技术中的重要分支受到国内外科研组织和学
随着集成电路技术和计算机技术的迅速发展,嵌入式系统性能提升的同时也使功耗问题成为制约系统设计和开发的重要因素。传统上处理器被认为是嵌入式系统中最耗能的部件,目前相
随着我国汽车工业快速发展,大中型客货车数量迅猛增加,机动车安全技术检验在保障车辆安全运行、预防和减少道路交通事故、保证人民生命财产安全发挥了重要作用[1]。其中道路
随着互联网行业的飞速发展,信息的产生和传播达到空前的速度,数据量呈爆炸式增长。互联网中充斥着大量的文本、音频、视频等各类数据,文本信息无疑是其中体量最大的数据资源,
网络虚拟化被认为是最可能有效解决网络僵化问题的技术方案之一。网络僵化指的是,传统的网络体系结构受制于固有的基于TCP/IP模式的数据传输方式,将无法始终满足日益增长的、
随着信息技术的不断发展,计算机需要处理的数据量和任务量日益增多,为了提高计算机程序的运行速度,越来越多的公司、科研机构开始通过结合中央处理器(CPU)和图形处理器(GPU)
插件机视觉定位系统是实现准确插件的关键,目前异型元件插件机的元件定位大多沿用通用贴片机的底部相机定位方法,由于异型元件针脚长而细,通过元件底部图像的本体区域进行定
随着创意产业的深入发展,推动社会逐步向创意社会迈进,在此基础上加大对于目前社会形态的研究,能够为创意社会发展提供一个可供参考的理论依据。文章共包括四个部分,第一部分
QR码作为移动互联网的入口之一,凭借其制作方便、存储容量大以及扫描稳定等特点,成为人们日常生活中最常使用的二维码。但是,由杂乱无章的黑白块构成的传统QR码,较差的视觉效