一种基于连通域标记的纸病检测算法

来源 :中国造纸学报 | 被引量 : 0次 | 上传用户:uuuiiiuuui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:提出了一种基于段的连通域标记处理算法,同时对纸病区域进行连通域标记和形状特征值提取,旨在提高纸病检测的准确率和效率。该算法利用纸病区域为简单连通图像的特点,采用段技术实现了纸病区域的标记处理,探讨了在标记处理同时快速统计与形状特征值计算有关的中间参数的方法,利用标记结果及形状特征值实现了纸病的快速检测。该算法优化了标记处理与形状特征值提取的过程,减少了纸病图像的扫描次数。结果表明,该算法达到了准确、快速的纸病检测效果,且易于扩展到实际的纸病检测系统中。
  关键词:连通域标记;段标记;形状特征提取;纸病检测
  中图分类号:TP39
  文献标识码:A
  DOI:1011981/jissn1000684220180251
  随着纸机向高速度、高精度和自动化方向的发展,利用计算机视觉等技术实现低成本、高效率的纸病检测成为当前的主要研究热点。纸病区域的识别及特征值的提取是实现纸病检测的重要步骤[12]。
  连通域标记处理[34]作为基本的图像处理过程,将二值图像中属于同一连通域的所有物体像素用唯一的标号进行标记的过程,是计算物体数量、面积、周长、圆形度、中心等形状特征的前提,是实现图像处理的重要步骤[5]。连通域标记处理在实现不同物体区分方面具有速度快、方法简单、实时性好、准确度高等优点,已被广泛应用于指纹识别[6]、实时监控系统[7]、目标跟踪[8]等领域,并取得了良好的应用效果。连通域标记算法的高效性和实时性特征满足纸病检测对实时性的需求。纸病区域像素的灰度值及形状特征值是纸病检测不可缺少的重要因素,本课题提出适合于纸病检测的灰度图像的标记处理,且在标记处理的同时统计与形状特征值计算相关的中间参数,在标记处理完成后依据标号值及形状特征值实现简单、快速、准确的纸病检测。
  1算法基本原理
  11基于段的连通域标记处理
  常见的纸病图像中,不管是孔洞、黑斑还是边缘裂口,在各类纸病区域中所有纸病像素均为连通像素,在其内部不存在独立的正常纸区域,所以纸病图像属于简单连通图像[9]。
  基于纸病图像为简单连通图像的特点,提出基于段的连通域标记处理。所谓段是指扫描行中一个连续的物体像素块[4],其示意图如图1所示(任意像素可以是紙病像素也可以是背景像素),图1中像素s到像素e之间的物体像素块称为段,属于一个连通域。以段为对象标记处理的过程优化了目前传统的基于单一像素的标记处理过程。图2所示的传统方法[3]完成当前像素p的标记处理需要检查4个邻接像素r1、r2、r3、r4,邻接像素的检查操作冗余,影响标记处理的速度。而以段为单位的标记处理过程,简化了邻接像素的检测次数,避免了单一像素工作窗中邻接像素的冗余检测操作,从而显著提高标记处理的速度。
  12灰度图像的转换
  图3为几种常见的纸病图像,其中黑斑和孔洞的形状与边缘裂口有明显的差异,形状细长且弯的是边缘裂口,而接近椭圆形的是黑斑和孔洞。可见,黑斑和孔洞的形状特征值相似,不能作为区分黑斑和孔洞的依据。从像素的灰度值来看,黑斑的灰度值低于背景像素灰度均值,而孔洞的灰度值高于背景像素灰度均值,因此灰度值是区分这两种不同类型纸病的重要依据;而黑斑与边缘裂口灰度值均低于背景像素灰度均值,但可依据它们形状特征值的不同加以区分。可见,像素灰度值在区分黑斑和孔洞这类形状特征相似的纸病时是必不可少的重要依据,而对于黑斑和边缘裂口这类形状特征值差别较大的纸病识别时可以不依赖于像素的灰度值。
  基于像素灰度值对于纸病检测的重要性,将纸病灰度图像转换为二值图像进行连通域标记处理显然增加了处理的复杂度。综合灰度值及形状特征值对于纸病检测的影响,本课题首先对纸病灰度图像按照像素灰度值与背景像素灰度均值的偏离程度有选择地进行灰度转换。图3所示的纸病图像,背景灰度均值为210,黑斑的灰度值低于190,孔洞的灰度值高于230。依据阈值190和230,转换后的灰度图像包括3类:第一类为背景灰度像素;第二类的像素灰度值为0,这类像素是由黑斑、边缘裂口等像素灰度值低于背景像素灰度均值的像素转换得到;第三类的像素灰度值为255,这类像素由孔洞等像素灰度值高于背景像素灰度均值的像素转换得到。
  依据上述阈值,图4为图3转换后得到的纸病图像,在图4所示的灰度图像上进行纸病检测处理,简化了连通域标记处理的过程,且不影响灰度值对于纸病检测的识别效果。
  13统计形状特征值计算所需的中间参数
  纸病区域的形状特征值包括面积、周长、圆形度、长宽比及矩形度等,是区分不同种类纸病的另一必要条件。在连通域标记基础上实现目标识别方法中,通常将连通域标记处理与形状特征值的统计分开、独立完成。但是各个形状特征值统计与连通域标记处理都需要扫描像素,分析像素与邻接像素间的关系等操作,所以在连通域标记处理和特征值提取两个操作过程间存在公共操作,独立完成方法中存在冗余操作。本课题算法在进行标记处理时统计并存储与计算形状特征值有关的中间信息,以此简化冗余操作提高纸病检测效率。
  2算法实现
  纸病灰度图像的纸病区域是标记和统计形状特征值的目标,也就是连通域,为了表述方便,以下所有关于连通域标记处理均统一表述为纸病区域的标记处理。
  21灰度图像的标记处理
  本课题中将合格纸张区域的像素称作“背景像素”。在含有纸病的图像中,纸病区域相对于合格纸张区域的面积小很多,背景像素的个数远远大于纸病区域像素的个数,所以在对当前扫描的像素p进行检查时,首先检查像素p是否为背景像素,若是背景像素,则会直接进入下一个像素的检查处理,否则像素p一定为纸病像素。如果像素p的值等于0,则判定为像素灰度值低于背景灰度均值的纸病,设定为第1类纸病,否则像素p为像素灰度值高于背景灰度均值的纸病,设定为第2类纸病,进行基于段技术的纸病区域标记处理过程。第1类纸病的标号值用变量l1表示、第2类纸病的标号值用变量l2表示,变量l1和l2均被初始化为1。   在逐行扫描像素的过程中,当一个纸病像素的左邻像素为背景像素时,则该像素为当前段的段首像素(如图5所示),记作rs,将其位置存储于段首数组run_s 中。当检测到段中一个纸病像素的右邻像素为背景像素时,则当前的纸病像素为段尾像素,记作re(如图5所示),将其位置存储于段尾数组run_e 中,根据当前段在上一行是否存在有邻接段,分两种情况对当前段进行标记处理:(a)在当前段的上一行不存在邻接段,表明当前段为新出现的纸病区域的首行,根据段所属种类用当前标号l1 或l2 进行标记,标记结束后相应的标号变量值增1。(b)在当前段的上一行存在有i (i≥1)个邻接段,当i等于1时,则用邻接段的标号标记当前段;当i大于1时,则从多个邻接段中选择最小标号作为当前段的标号,并进行等价标号合并的处理。
  22实现统计形状特征值计算所需的中间参数
  假设一纸病区域PA的标号值为l(l可以是l1或者l2),其面积、圆形度、长宽比和矩形度等形状特征值依次表示为PA[l]A、PA[l]C、PA[l]ρ、PA[l]γ,各形状特征值的计算分别见公式(1)~公式(4)。
  PA[l]A={p(x, y) | p(x, y)=l}(1)
  PA[l]C=4π×PA[l]A/ P2(2)
  PA[l]ρ= W / L(3)
  PA[l]γ= PA[l]A / W / L(4)
  公式(1)定义标号为l的纸病区域的面积为当前纸病区域像素的个数。
  公式(2)定义圆形度中的参数P表示纸病区域PA[l]的周长。根据当前段中的边界像素计算周长,所谓边界像素是指在该像素的邻接像素中存在有背景像素,周长的计算见公式(5),参数Ne表示水平步或者垂直步,参数No表示对角步,具体类型划分如图6所示。图6(a)中当前边界纸病像素p与邻接的纸病像素处于一个段,按水平步计算周长,图6(b)中当前边界纸病像素p与邻接纸病像素为垂直关系,按垂直步计算周长,图6(c)中当前边界纸病像素p与左上方或者右上方纸病像素形成对角关系,按对角步计算周长。
  P=Ne+2No(5)
  公式(3)中定义纸病区域的长宽比的参数值W表示纸病区域PA[l]最小矩形的长度,计算见公式(6)。参数值L代表纸病区域PA[l]的最小矩形的宽度,计算见公式(7),其中参数X0、X1分别表示一个纸病区域中像素的最小横坐标值及最大横坐标值;参数Y0、Y1分别表示一个纸病区域中像素的最小纵坐标值及最大纵坐标值。
  W=X1-X0(6)
  L=Y1-Y0(7)
  公式(2)~公式(4)、公式(6)、公式(7)左侧的形状特征值的计算分别与面积A、周长P、最小横坐标X0、最大横坐标X1、最小纵坐标Y0和最大纵坐标Y1的值有关,从公式(1)、公式(5)及X0、X1、Y0及Y1的定义明确这6个参数值的计算均与纸病区域PA[l]的像素有关,可以在标记处理过程中进行统计,所以纸病形状特征值计算所需的中间信息分别为面积A、周长P、最小横坐标X0、最大横坐标X1、最小纵坐标Y0和最大纵坐标Y1这6个参数值。
  中间信息值面积A、周长P等参数值的统计与段标记也分两种情况计算纸病区域的参数值:① 当前段在上一行不存在邻接段。当前段的存在表示新的纸病区域的出现。用段首像素的横坐标和纵坐标分别初始化当前纸病区域的最小横坐标X0和最小纵坐标Y0,用段尾像素的横坐标和纵坐标分别初始化当前纸病区域的最大横坐标X1和最大纵坐标Y1,新的纸病区域面积用式PA[l]A=run_e[l]x-run_s[l]x(run_e[l]x表示段尾元素的横坐标,run_s[l]x表示段首元素横坐标)计算,周长用式P=run_e[l]x-run_s[l]x计算。② 当前段在上一行中存在有邻接段。当前段与邻接段同属于一个纸病区域PA[l],如果当前段的段首元素的横坐标run_s[l]x小于当前纸病区域的最小横坐标X0,则X0=run_s[l]x;当前段的段尾元素的横坐标run_e[l]x大于当前纸病区域的最大横坐标X1时,则X1=run_e[l]x;当前纸病区域的最大纵坐标Y1=run_e[l]y,run_e[l]y表示当前段的段尾元素的纵坐标。当前纸病区域的面积为已有面积加上当前所有像素的个数,表示为PA[l]A=PA[l]A+run_e[l]x- run_s[l]x。周长按照图6的情况统计段中的水平步及垂直步像素的个数于参数Ne中,統计对角步像素的个数于参数No中。
  统计好纸病区域PA[l]的面积A,周长P、最小横坐标X0、最大横坐标X1、最小纵坐标Y0和最大纵坐标Y1的值后,根据公式(6)、公式(7)计算W和L的值,再根据公式(2)~公式(4)计算各个纸病区域的圆形度PA[l]C、长宽比PA[l]ρ和矩形度PA[l]γ等形状特征值。
  23纸病识别
  根据22节的分析,每个纸病区域的特征值均存储在对应的结构体数组变量PA[l]中,l表示当前纸病区域的标号,数据项PA[l]T的取值为1或者2,表明当前纸病区域为第1类纸病或为第2类纸病。再根据变量PA[l]中各个数据项:圆形度PA[l]C、长宽比PA[l]ρ、矩形度PA[l]γ和面积PA[l]A等值判断当前纸病区域的具体类型及大小,输出纸病检测结果。
  另外用于表示标号的两个变量l1和l2,分别表示当前第1类纸病的总个数和第2类纸病的总个数,两个变量的和用来表示总的纸病区域的个数。
  3实验仿真与分析
  本课题算法的实现主要涉及段存储及形状特征值表示两个数据结构,用Run_Type和Dfect_Area分别表示段数据类型及纸病区域数据类型。以下是关于Run_Type和Dfect_Area的详细定义和解释说明。
  在以下的纸病检测实验仿真中,算法实现以上述Dfect_Area为数据类型定义纸病区域形状特征值变量,存储各个纸病区域的形状特征值,一维数组的下标等于当前纸病区域的标号值。   31实验仿真结果
  本课题提出的用于纸病检测的算法用VC实现,在图4所示的灰度图像上进行实验测试。纸病区域的标号值、形状特征值及检测结果如表1所示。灰度类型T值表明了纸病区域所属的类型,其中T值“1”表示当前纸病区域的像素灰度值均低于背景灰度均值,初步划分为黑斑和边缘裂口等第1类纸病,T值“2”表示当前纸病区域的像素灰度值均高于背景灰度均值,初步划分为孔洞等第2类纸病。标号值l是代表标记处理后属于同一纸病区域的像素标号值,用于统计纸病的数量。圆形度、长宽比及矩形度是区分不同纸病的重要形状特征值,同为第1类纸病的黑斑和边缘裂口的这3项形状特征值具有明显的差别,通过这3项形状特征值可以区分黑斑和边缘裂口等这类灰度类型T值接近的纸病。面积反映了各纸病区域的大小。实验结果证实,灰度类型T值及形状特征值是实现纸病快速检测的重要依据。
  表1给出的实验结果与实际纸病图像上的纸病类型一致,表明本课题提出的基于连通域标记的纸病检测算法能够直接作用于灰度图像进行纸病区域的形状特征值的统计,并且能够实现不同纸病的准确检测。
  32算法效率分析
  像素灰度值及纸病区域形状特征值是实现纸病检测的必要条件,它们的处理速度决定了纸病检测的速度。本课题采用了段技术的连通域标记处理方法,以段替代单一像素为标记对象的处理方法。基于段的标记处理过程与基于单一像素的标记处理过程均是从上到下、从左到右逐一扫描像素实现的,所以两者实现的时间复杂度相同,均为但是传统的以单一像素(见图2)为标记对象的处理方法,当该像素p的上一行、同一列邻接像素为背景像素时,邻接的4个像素均需要检查,这是此类标记处理中的最坏情况。假设一个包含有m个像素的段中有n个像素符合最坏情况,则对该段的检查次数≥m+3n,在m值一定的段中,n值越大,所需检查的邻接像素越多;而在基于段(见图1)的连通域标记处理中,不需要检查段内每个像素的邻接像素,仅需要查看段首像素或者段尾像素的上一行、同一列位置上的邻接像素是否为背景像素,如果同时为背景像素,则为段标记处理的最坏情况。假设在上一行有c个段,用符号s*和e*分别表示当前段的段首像素rs和段尾像素re在上一行、同一列位置上的像素,需要检查这c个段中是否存在有段的段首像素处于s*和e*之间。最坏情况邻接段的检查次数为c次,c值越大,检查次数越多,但在一行中,特别是在背景像素远远大于纸病像素的纸病检测中,一行中段的个数远远小于当前行中物体像素的个数,所以c  本课题提出的基于段的连通域标记处理直接对原始图像进行标记,不需要额外的内存空间存储标记后的图像,但需要保存段和形状特征值的数据。在最坏的情况下,
  4结语
  随着“中国制造2025”的全面实施,智能化的纸病检测技术代替人工检测是造纸企业未来发展的重要方向,简单高效的纸病检测算法的研究具有重要价值。本课题提出了一种灰度图像上的基于段技术的连通域标记的纸病检测方法,实现了在标记处理的同时统计与形状特征值圆形度、长宽比、矩形度等值计算有关的面积、周长等中间参数,以简单、高效的手段实现了纸病检测处理,且易于扩展到实际的纸病检测系统中。在后续的研究工作中,将借鉴图像差分技术改进灰度图像的转换预处理过程,以提高本算法实现纸病检测的速度。
  参考文献
  [1] ZHANG Xuelan, LI Jun, MENG Fankong, et al. A Paper Defects Detection Method Based on Machine Vision[J]. Transactions of China Pulp and Paper, 2013, 28(1): 48.
  张学兰, 李军, 孟范孔, 等. 一种基于机器视觉的纸病识别方法[J]. 中国造纸学报, 2013, 28(1): 48.
  [2] YANG Bo, ZHOU Qiang, ZHANG Gangqiang. Study on Algorithm of Paper Defect Detection Based on Geometric and Gray Feature[J]. China Pulp & Paper, 2011, 30(9): 50.
  杨波, 周强, 张刚强. 基于几何及灰度特征的纸病检测算法研究[J]. 中国造纸, 2011, 30(9): 50.
  [3] He L, Chao Y, Suzuki K, et al. Fast connectedcomponent labeling[J]. Pattern Recognition, 2009, 42(9): 1977.
  [4] He L, Chao Y, Suzuki K. A runbased twoscan labeling algorithm[J]. IEEE Transactions on Image Processing, 2008, 17(5): 749.
  [5] Chia A Y S, Rajan D, Leung M K, et al. Object Recognition by Discriminative Combinations of Line Segments, Ellipses, and Appearance Features[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(9): 1758.
  [6] Chen G, Xie M, Yu Y. Estimation of Fingerprint Orientation Field Based on Improved Structure Tensor[M]. Springer Berlin Heidelberg, 2012.
  [7] Hsia C H, Guo J M. Efficient modified directional liftingbased discrete wavelet transform for moving object detection[J]. Signal Processing, 2014, 96(5): 138.
  [8] Malik A A, Khalil A, Ullah Khan H U. Object Detection and Tracking using Background Subtraction and Connected Component Labeling[J]. International Journal of Computer Applications, 2013, 75(13): 1.
  [9] Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing[M]. 3th. Beijing: Publishing House of Electronics Industry, 2011.
  剛萨雷斯, 伍兹. 数字图像处理[M]. 3版. 北京: 电子工业出版社, 2011.
其他文献
当前,纸浆产业的全球化趋势是纸和纸板在印刷、信息领域的需求出现下降,而因网络购物的兴起,其在包装领域需求逐渐上升。今后全球以资源的可持续和循环型产业为发展方向,与其他竞争材料相比,作为包装材料的纸和纸板,需要看它能否发挥出自身的优越性能。最近使用塑料包装容器所导致的海洋污染问题正在唤起全社会对环境问题的高度关注,国际型需求的大企业也纷纷提倡脱塑化,因此,在包装领域将加快“向纸回归”的趋势。  在世
期刊
摘 要:木素是自然界储量仅次于纤维素和甲壳素的天然大分子聚合物。从化学结构上看,木素由愈创木基、对羟苯基和紫丁香基三种结构单元以醚键和碳碳双键连接而成,结构十分复杂,且在植物原料中,木素与纤维素和半纤维素紧密地联系在一起,利用现有手段很难分离出纯木素。木素对制浆过程,尤其是对蒸煮和纸浆漂白有重要影响,为深入理解木素在制浆过程中发生的化学反应机理及其结构变化,需要借助木素模型物进行木素的相关研究。本
期刊
摘 要:为了解决纸张缺陷检测中多个纸病区域的提取实时性问题,提出了一种采用“先分块、后合并”思想直接对实时图像数据流进行处理的并行化纸病提取算法。该算法充分利用现场可编程门阵列(FPGA)的并行处理特性,在跨时钟域对图像数据进行传输的同时,在另一个分支流程中并行地对分块缺陷连通域进行标记以获取每个缺陷的相对位置坐标,最后以包围盒的形式提取出纸张缺陷区域。该算法基于分块思想,分支处理过程不需要消耗主
期刊
摘要:本文选取棉花、白糖2个代表性商品期货品种,基于信息份额模型,测算分析了疫情期间及近几年同期我国商品期货市场相对于现货市场、国外同类品种期货市场的信息份额(价格发现贡献度)。结果表明:疫情期间,我国商品期货市场的价格发现功能不仅没有下降,反而有一定幅度提高。最后,本文提出如下几条建议:①丰富期货品种功能评估工具箱,可将“信息份额”纳入功能评估指标体系,从而有助于交易所更加直观地评估期货品种价格
期刊
摘要:“保险+期货”是一种创新型金融产品,通过保险公司连接农户和期货公司,可以有效将农户面临的农产品市场风险转移至期货市场,逐渐成为农业风险管理的重要工具。本文通过分析“保险+期货”项目的运行原理、特点和创新,总结出目前“保险+期货”试点存在的问题,并提出未来发展完善的思路。关键词:“保险+期货”農业风险管理价格风险  一、引言  自2015年义县玉米首个“保险+期货”项目顺利开展以来,“保险+期
期刊
摘要:本文以中国软件的历史实际走势为例,围绕证券中长期均线(60日和120日均线)的突破展开论证,验证了突破中长期均线往往意味着大级别行情的开始这一结论,并且对中长期均线的真假突破和投资者应注意的问题以及如何操作进行了探讨。  关键词:中国软件中长期均线突破操作  1柳岸林(1980—),男,汉族,山东烟台人,广州商学院经济学院教师,经济师,硕士,主要从事证券投资研究。  Abstract:Thi
期刊
摘要:“保险+期货”试点是中国农业风险管理领域的热点议题,也是中央推进的保障农民收入的重要举措。本文以2018年在黑龙江省调研收集的506户微观农户数据为研究对象,基于双重差分模型,评估了“保险+期货”试点对农民农业收入的作用效果,结果发现:参加试点可以显著提高农民的亩均补贴赔偿收入,同时对其亩均卖粮收入有显著的负向影响。现阶段“保险+期货”试点发挥的收入保障功能主要源于农民从农业保险合约中获得的
期刊
摘要:近年来,国内证券违法违规现象高发,证券欺诈纠纷亦频繁出现。我国证券虚假陈述因果关系认定规则借鉴了美国“欺诈市场理论”。本文通过对该理论溯源式研究和跨学科分析,探讨了其在证券虚假陈述因果关系认定中的适用性问题。研究结论表明,我国认定规则在借用了“欺诈市场理论”的推定框架,却忽视了理论中预留的前提和假定,证券虚假陈述因果关系认定规则不仅存在理论逻辑漏洞,且可能与证券市场的实际情况相脱节。关键词:
期刊
摘要:分析了绿竹竹龄和竹秆径向部位对纤维的长度及其分布频率、宽度、长宽比、壁厚、腔径、壁腔比的影响规律。结果显示,竹壁中层纤维的长度和长宽比较大,内层纤维较小;纤维宽度和壁腔比则是竹壁外层纤维较大,内层纤维较小;纤维腔径为竹壁内层纤维较大,中层和外层纤维较小。不同竹龄的绿竹纤维长度在1687~1961 μm之间,属长纤维类型;纤维宽度在119~176 μm之间,长宽比为104~147;纤维双壁厚随
期刊
摘要:针对制浆黑液的特点,采用元素分析仪、X射线衍射仪(XRD)、能量散射光谱仪(EDS)及离子色谱(IC)等分析手段对黑液成分进行表征及定性定量分析,并对黑液的蒸发特性进行了初步研究。元素分析结果表明,黑液蒸发后的固体中含有N、C、H、S等元素。XRD谱图分析显示,煅烧后的黑液主要含有Na2SiO3、KCl、MgSO4、CaSO4等无机化合物。EDS结果进一步证实经过煅烧后的黑液残渣中含有Na、
期刊