论文部分内容阅读
图像分割是数字图像处理与计算机视觉领域的一项基本研究问题,通过将图像划分为若干互不重叠的子区域或光滑封闭的曲线,且每个子区域或封闭曲线具有特殊的含义,因此,它成为图像分析与视觉计算的研究基础。由于图像分割能为众多高层应用像跟踪、检测及识别提供最重要的依据,因而被广泛的应用于目标识别、场景分析、特效电影、目标检测、医学图像处理、工业检测、基于内容的图像检索等领域。然而,由于人类缺乏对视觉系统的深层认识,且视觉感知的自然彩色纹理图像中包含的内容具有多样性、复杂性、随机性等特点,截止目前,尚未有十分成熟的图像分割方法满足于各种应用环境需求,因此,如何提高图像分割的视觉效果、泛化性、通用性,依然成为图像处理和计算机视觉领域的研究热点与难点,并成为一个极具有挑战性的研究课题。针对计算机自主模拟人眼感知外部世界的微观结构、宏观结构以及抽象层次的功能,并能够准确识别和区分不同场景的目标,进而获得重要的语义信息,致使无监督的图像分割成为近几年来广泛关注的焦点。由于自然图像中包含丰富的色度、饱和度、光照、亮度等颜色信息,以及描述线性、均匀性、规则性、随机性、平滑性、粗糙度、密度、粒度、频率、相位、方向等与周围环境相互关联的纹理信息,导致将颜色信息与纹理信息进行有机结合的彩色纹理图像分割方法成为本章研究的重点。近年来,由于对图像分割任务的健壮性、鲁棒性、实时性的需求,促使利用Graph Cut图切割优化方法实现全局最优化分割,成为当前实现图像分割最主要的方法之一。其优势在于分割加权图的拓扑结构自由、数值鲁棒性强、多特征约束融合能力灵活、全局最优化与执行效率高等优点。但是,由于自然彩色纹理图像的复杂性、多样性、模式的随机性、以及类别数难自主确定,导致基于传统的图切割优化方法来实现无监督的多类彩色纹理图像分割任务,无论是方法本身的适用性、鲁棒性、准确性、还是实时性,都遭到严重的限制。因此,本章针对传统彩色纹理图像分割中存在的若干关键问题,进行定性分析与定量研究,理论研究与实际研究相结合,并研究了几种新型多类无监督的彩色纹理图像分割方法。其具体的创新性研究成果可归纳为如下几个部分:首先,提出了一种将压缩的多尺度结构张量纹理,颜色以及TV尺度倒数特征相结合的彩色纹理描述子。基于多尺度结构张量具有多尺度信息描述能力和全方向信息压缩能力,以及将频域与空域信息有机结合的功能,将它用于提取多尺度的纹理信息。但是,由于它具有矩阵集合结构,且满足黎曼流行特性,当对其进行流行空间距离度量及相关统计计算时,需先将结构张量在流行空间映射到切向量空间,然后利用测地线距离对其进行计算,因此具有较高的时间复杂度和巨大的内存空间消耗。此外,它难以与向量结构的颜色信息进行有机整体结合。针对这些问题,本章提出了一种新型彩色纹理描述子。通过对多尺度结构张量的各个尺度进行SVD奇异值分解,然后将它们整体结合并进行PCA降维,得到主方向压缩的多尺度纹理信息。同时,采用TV流全变分提取尺度倒数特征来弥补多尺度结构张量在大尺度上提取纹理信息较少的缺点。为了提高检测边缘的能力、抗噪声特性以及同一目标区域的同质性,最终对构建的新型彩色纹理描述子进行非线性扩散滤波。其次,提出了智能最大期望学生-t(CEM~3ST)算法,通过计算样本对混合概率密度的各个通道部分的样本支持程度,采用无效通道部分删除的方式自主确定图像中的有效类别数。为了模拟和加速有效类的信息传输,利用半隐形的方案替代显性方案,通过一次更新一个有效通道部分来加快收敛。为了删除无效通道部分的影响,在对多变量学生-t分布的EM最大期望统计计算的迭代过程中,利用当前已经更新过的有效通道部分与上次尚未处理的有效通道部分,共同参与当前部分的决策,并对样本支持程度进行归一化处理,剔除无效部分。换句话说,为了将无效部分的信息快速分配给其它的有效通道部分,利用最小二乘与ML最大似然的方法更新各个有效部分的相关统计参数,以及当前的有效类别数,进一步计算样本对有效部分的样本支持程度。再次,提出了基于边与基于区域的多类连续活动轮廓模型(MSACM)。具体地,通过对CV模型的区域外力与边缘内力的约束改进,将GMM多变量混合高斯模型用来刻画分段区域内的PDF概率密度描述,它打破了区域内常数概率密度的假设。这有利于提高同质目标区域的检测与噪声容忍能力。此外,将GAC测地线活动轮廓模型扩展到能量泛函的平滑项中,进一步提高对凹型边界的检测能力与抗噪特性。对于MSACM变分活动轮廓模型的最优化求解,通常等价于其能量最小,可采用数值离散化的水平集方式进行求解。然而,由于水平集方式极易限于局部最小,且收敛速度较慢。因此,本章采用Cauchy-Crofton公式进行多类离散化近似,将能量最小化问题转化为MLG多层图割模型的最大流/最小割问题,利用Graph Cut快速求得全局近似最优解。最终,分割后的同质目标区域更加完整,能够捕获较深的凹型边界,且边界更加光滑。最后,提出了基于多变量学生-t分布与区域可信融合的无监督彩色纹理图像分割方法。针对图像分割中存在的高斯型,非高斯型以及长尾巴型的PDF概率密度描述,本章使用多变量混合学生-t分布(MMST)对图像进行概率分布(PDF)建模。它能结合CEM~3ST算法自适应确定初始的有效类数,这大大降低了构建多类图割模型的层数。此外,由于分割后的区域经常出现过分割以及错误分割现象,我们提出了区域可信融合策略。它通过将分割后区域的邻接关系、区域大小、区域公共边、以及区域之间的特征相似性-J散度距离,共同计算任意两个相邻区域间的区域可信融合度。通过合理的判别,将融合度较小的区域进行删除或融合。此外,为了实现自适应的迭代分割过程,将每次分割后有效通道部分的Kullback-Leibler(KL)概率密度距离与所有特征样本的能量相结合,自适应控制迭代分割过程的收敛,保证最终分割的区域结果具有视觉整体性与区域一致性。