论文部分内容阅读
条码技术经过多年发展,因为其经济、便利、可行等特点,已经在物流、零售、供应链管理等领域得到广泛应用。近年来随着智能手机和移动互联网的普及,条码技术也从过去单纯的货物标签用途,转向了更为广阔的应用场景。在工业应用中,对基于图像的高速、精准且具备一定鲁棒性的条码定位算法有独特的需求。为了提高在工业场景中条码识读的自动化水平,图像处理技术在条码定位问题中得到了众多应用。传统基于图像的定位算法主要应用现有的理论成果,利用图像处理方法,从图像中得到条码的大致位置进行识读。此类方法对于一般条件下的条码有不错效果,但是自适应程度较差,难以处理诸如尺度、模糊等变换问题。同时定位精度较粗糙,无法得到较为准确的条码顶点信息。区别于人工的特征选取技术,深度学习技术被证明能够学习样本内部的统计规律和特征,得到超越人工特征的识别效果。本文在对现有算法充分调研的基础上,对应用图像处理和机器学习方法实现的条码定位问题做了深入的研究。主要的研究内容和贡献包括下面几个方面:1.研究了国内外发表的主要条码识别和定位工作。深入研究和比较了现有条码识读装置的特点的基础上,明确了利用数字图像处理条码定位问题的优势。在广泛阅读相关文献后,对现有定位方法进行分类和整理,为后续工作奠定了基础。2.针对作为研究对象的线性码、PDF417码、线性堆叠码与线性PDF堆叠码四种条码类型,设计了使用图像处理方法的条码顶点定位方案。结合信息熵的计算概念,提出基于区域块的梯度统计检测。利用粗定位和有针对性设计的精确定位的两步定位方法,在模糊、光照明暗、尺度、旋转、位移、倾斜等八种图像变换下实现平均80%的定位准确度。3.将深度学习结构引入条码定位问题。区别于图像方式的人工特征设计,在模型中使用学习算法自主学习出适合于表现样本特性的特征。并对于PDF417码和线性码分别构建了包含13万与9万4千样本的数据集用于训练和测试。4.使用深度学习框架Caffe,搭建了具有两个卷积池化层对与两层全连接层组成的卷积神经网络,并利用GPU的硬件加速方式,在构建的数据集下对样本进行训练和测试。证明了学习算法与深度网络结构在条码定位问题中的有效性。