论文部分内容阅读
交互式图像分割是指在用户提供的先验知识下,基于一定的相似性准则将用户感兴趣的目标从复杂的图像背景环境中分离出来,它是图像分析、模式识别和计算机视觉等领域中的一个关键问题,分割质量的好坏将直接影响后续相关应用。由于具备多特征融合、全局最优、执行效率高等优良特性,近年来基于图论方法的研究受到了国内外学者的广泛关注,并成为了主流的交互式图像分割方法之一。当用户提供足够多的种子点时,传统基于图论的方法在分割简单彩色图像时往往能获得较好的分割结果。然而,该类方法对种子点的数量和位置较为敏感,当用户交互有限时,很难获得满意的分割。此外,传统图论方法只利用图像的局部像素关系来指引分割,由于没有充分利用图像的结构信息,往往较难分割包含噪声和纹理的图像。这些缺陷严重影响了该类方法的准确性和鲁棒性,限制了其实用性。针对上述问题,本文深入分析和研究基于图论的交互式图像分割方法,在传统图模型中引入图像非局部关系、基于图像块和超像素的高阶关系以及基于相似性传递的图像全局关系,并结合信息论、模式分类、数值分析方法等,利用统计学习方法和先验启发式信息,对基于图论分割框架的能量函数的构建、优化等诸多环节进行了设计,研究高质量、高效的图像交互式分割方法。本文所做的主要工作与创新性成果如下:(1)提出了一种结合非局部信息与图割的交互式图像分割算法。该算法将传统图模型的局部像素关系扩展到图像非局部关系,通过为图像中每个像素设置搜索窗口,计算窗口内非局部图像块对之间的相似性来获取非局部信息,并在图割模型的边界能量项中引入该非局部约束,以提高算法的分割精度。(2)针对非局部方法在图像块相似性计算时的准确性和效率方面的缺陷,提出了 一种基于图像块特征学习的交互式图像分割算法。该算法利用高斯混合模型分别对图像前景和背景的图像块结构特征进行学习,来获取图像的结构信息。此外,为了克服图像块无法精确保存图像边界信息的缺陷,将获取的图像结构信息与像素层信息进行有效的融合,并将该组合信息引入到图割模型的区域能量项中,进一步提高对图像边界区域的分割精度,可以较好地分割含噪和纹理图像。(3)为了进一步提高算法的分割精度和对种子点的鲁棒性,将像素、超像素以及标签之间的多层关系进行融合,提出了两种交互式多标签图像分割算法:基于博弈论优化的分割算法和基于局部并行优化的分割算法。前者算法利用无参概率学习的方法分别估计像素和超像素属于每个标签的概率,并采用基于博弈论的优化策略迭代更新像素和超像素的概率,直至收敛。后者算法基于马尔可夫随机场框架构建分割模型,对于提出的多标签子模函数采用局部并行优化策略进行求解。多层图关系的构建可以有效地提高分割质量,基于博弈论和局部并行的优化方法可以有效地提高算法的优化效率。(4)针对基于像素层关系的方法分割精度较低和基于高阶关系的方法复杂度较高的缺陷,提出了一种基于关系传递的交互式图像分割算法。该算法通过传递邻域像素之间的相似性来估计图像所有像素之间的全局关系,当迭代步骤趋向于无穷时,传递的关系矩阵收敛到一个鲁棒的极值。基于获取的图像全局关系构建分割模型,通过高斯混合模型对种子点进行建模,估计像素属于标签的初始概率,并将其作为一种“软约束”引入到分割模型中,取代传统的基于种子点的“硬约束”关系,进一步提高了分割精度。该算法实现简单,在提高分割精度的同时又保证了较高的实时性。(5)将单幅图像分割扩展到序列图像分割,并应用到频域光学相干断层成像视网膜图像中,提出了一种交互式视网膜序列图像水肿分割算法。用户只需在一幅基于视网膜厚度自动确定的关键帧图像中进行交互,算法将自动完成整个序列图像的分割。通过在马尔可夫随机场框架中引入高阶能量来进一步提高分割精度;通过利用相邻帧图像之间的移动估计来传递标签流,以保持分割结果的空间连续性。构建的高阶能量函数可以通过引入辅助变量转化为二次子模函数,从而利用最大流/最小割算法可以获得全局最优解。