论文部分内容阅读
近年来,在医疗输液制剂生产行业,由于自动化灌装技术的应用,输液灌装制剂的年生产量极大。而对产品质量的检测环节还处于人工视觉检测的阶段,大大限制了生产效率。本课题通过使用以深度学习算法为主的机器视觉技术,设计输液瓶标签文本检测系统,来代替人工检测,提高生产效率。本课题以工业医疗输液瓶生产环境为研究背景,围绕输液瓶外观标签的文本检测与识别方法展开研究,以深度学习技术为核心,在前人的研究基础上拓展,设计了大输液外观文本检测系统。课题对系统需求及组成进行了介绍,并对系统的稳定性及实时性进行了验证。针对标签文本倾斜的问题,本课题设计了基于傅里叶变换与霍夫变换的文本校正方法。通过对输入进行傅里叶变换的方式,对图像在频域进行角度检测以及旋转校正。最后对方法进行了实验,并对方法在检测准确度和检测时间两方面进行评估。针对文本检测的需求,设计了卷积神经网络与递归神经网络联合训练的网络结构。通过卷积神经网络与递归神经网络构成联合网络的形式,有效利用图像中文本区域的上下文信息,降低了文本区域误检和漏检;本文还设计了细致尺度文本区域的方法,提高了文本区域水平检测的精度;本文还设计了在网络中加入可训练参数对预测的文本框进行边缘细化的方法,进一步提高与标签真值区域的拟合程度。针对文本识别的需求,设计了基于联结时序分类的文本识别网络。本课题首先使用基于联结时序分类的递归神经网络结构与卷积神经网络联合训练,避免了对文本的预分割和后处理的操作。然后通过数据集的扩充,提高了网络的整体效果。本文为测试系统是否满足工业需求,首先对各个模块单独进行实验,再对系统整体进行联合实验,虽然整体实验结果与单独测试相比有所下降,但单个模块的效果非常理想,这证明了所设计系统的有效性,具有改进的潜力。