基于多尺度结构张量的无监督彩色纹理图像分割方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wang218
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分割是数字图像处理与计算机视觉领域的一项基本研究问题,通过将图像划分为若干互不重叠的子区域或光滑封闭的曲线,且每个子区域或封闭曲线具有特殊的含义,因此,它成为图像分析与视觉计算的研究基础。由于图像分割能为众多高层应用像跟踪、检测及识别提供最重要的依据,因而被广泛的应用于目标识别、场景分析、特效电影、目标检测、医学图像处理、工业检测、基于内容的图像检索等领域。然而,由于人类缺乏对视觉系统的深层认识,且视觉感知的自然彩色纹理图像中包含的内容具有多样性、复杂性、随机性等特点,截止目前,尚未有十分成熟的图像分割方法满足于各种应用环境需求,因此,如何提高图像分割的视觉效果、泛化性、通用性,依然成为图像处理和计算机视觉领域的研究热点与难点,并成为一个极具有挑战性的研究课题。针对计算机自主模拟人眼感知外部世界的微观结构、宏观结构以及抽象层次的功能,并能够准确识别和区分不同场景的目标,进而获得重要的语义信息,致使无监督的图像分割成为近几年来广泛关注的焦点。由于自然图像中包含丰富的色度、饱和度、光照、亮度等颜色信息,以及描述线性、均匀性、规则性、随机性、平滑性、粗糙度、密度、粒度、频率、相位、方向等与周围环境相互关联的纹理信息,导致将颜色信息与纹理信息进行有机结合的彩色纹理图像分割方法成为本章研究的重点。近年来,由于对图像分割任务的健壮性、鲁棒性、实时性的需求,促使利用Graph Cut图切割优化方法实现全局最优化分割,成为当前实现图像分割最主要的方法之一。其优势在于分割加权图的拓扑结构自由、数值鲁棒性强、多特征约束融合能力灵活、全局最优化与执行效率高等优点。但是,由于自然彩色纹理图像的复杂性、多样性、模式的随机性、以及类别数难自主确定,导致基于传统的图切割优化方法来实现无监督的多类彩色纹理图像分割任务,无论是方法本身的适用性、鲁棒性、准确性、还是实时性,都遭到严重的限制。因此,本章针对传统彩色纹理图像分割中存在的若干关键问题,进行定性分析与定量研究,理论研究与实际研究相结合,并研究了几种新型多类无监督的彩色纹理图像分割方法。其具体的创新性研究成果可归纳为如下几个部分:首先,提出了一种将压缩的多尺度结构张量纹理,颜色以及TV尺度倒数特征相结合的彩色纹理描述子。基于多尺度结构张量具有多尺度信息描述能力和全方向信息压缩能力,以及将频域与空域信息有机结合的功能,将它用于提取多尺度的纹理信息。但是,由于它具有矩阵集合结构,且满足黎曼流行特性,当对其进行流行空间距离度量及相关统计计算时,需先将结构张量在流行空间映射到切向量空间,然后利用测地线距离对其进行计算,因此具有较高的时间复杂度和巨大的内存空间消耗。此外,它难以与向量结构的颜色信息进行有机整体结合。针对这些问题,本章提出了一种新型彩色纹理描述子。通过对多尺度结构张量的各个尺度进行SVD奇异值分解,然后将它们整体结合并进行PCA降维,得到主方向压缩的多尺度纹理信息。同时,采用TV流全变分提取尺度倒数特征来弥补多尺度结构张量在大尺度上提取纹理信息较少的缺点。为了提高检测边缘的能力、抗噪声特性以及同一目标区域的同质性,最终对构建的新型彩色纹理描述子进行非线性扩散滤波。其次,提出了智能最大期望学生-t(CEM~3ST)算法,通过计算样本对混合概率密度的各个通道部分的样本支持程度,采用无效通道部分删除的方式自主确定图像中的有效类别数。为了模拟和加速有效类的信息传输,利用半隐形的方案替代显性方案,通过一次更新一个有效通道部分来加快收敛。为了删除无效通道部分的影响,在对多变量学生-t分布的EM最大期望统计计算的迭代过程中,利用当前已经更新过的有效通道部分与上次尚未处理的有效通道部分,共同参与当前部分的决策,并对样本支持程度进行归一化处理,剔除无效部分。换句话说,为了将无效部分的信息快速分配给其它的有效通道部分,利用最小二乘与ML最大似然的方法更新各个有效部分的相关统计参数,以及当前的有效类别数,进一步计算样本对有效部分的样本支持程度。再次,提出了基于边与基于区域的多类连续活动轮廓模型(MSACM)。具体地,通过对CV模型的区域外力与边缘内力的约束改进,将GMM多变量混合高斯模型用来刻画分段区域内的PDF概率密度描述,它打破了区域内常数概率密度的假设。这有利于提高同质目标区域的检测与噪声容忍能力。此外,将GAC测地线活动轮廓模型扩展到能量泛函的平滑项中,进一步提高对凹型边界的检测能力与抗噪特性。对于MSACM变分活动轮廓模型的最优化求解,通常等价于其能量最小,可采用数值离散化的水平集方式进行求解。然而,由于水平集方式极易限于局部最小,且收敛速度较慢。因此,本章采用Cauchy-Crofton公式进行多类离散化近似,将能量最小化问题转化为MLG多层图割模型的最大流/最小割问题,利用Graph Cut快速求得全局近似最优解。最终,分割后的同质目标区域更加完整,能够捕获较深的凹型边界,且边界更加光滑。最后,提出了基于多变量学生-t分布与区域可信融合的无监督彩色纹理图像分割方法。针对图像分割中存在的高斯型,非高斯型以及长尾巴型的PDF概率密度描述,本章使用多变量混合学生-t分布(MMST)对图像进行概率分布(PDF)建模。它能结合CEM~3ST算法自适应确定初始的有效类数,这大大降低了构建多类图割模型的层数。此外,由于分割后的区域经常出现过分割以及错误分割现象,我们提出了区域可信融合策略。它通过将分割后区域的邻接关系、区域大小、区域公共边、以及区域之间的特征相似性-J散度距离,共同计算任意两个相邻区域间的区域可信融合度。通过合理的判别,将融合度较小的区域进行删除或融合。此外,为了实现自适应的迭代分割过程,将每次分割后有效通道部分的Kullback-Leibler(KL)概率密度距离与所有特征样本的能量相结合,自适应控制迭代分割过程的收敛,保证最终分割的区域结果具有视觉整体性与区域一致性。
其他文献
路遥延川县宣传队时期的文学阅读,大多来自曹谷溪书房和北京知青圈子中的“作品书单”,表征为某种业余、零碎和随意翻书的特点。延安大学中文系的课程和科班教育,使他获得了
目前CAD版本的数据模型是存在一定限制的,而且和GIS矢量数据模型是不兼容的,这两个问题令GIS数据在转换后经常会出现很多问题,降低转换的质量。本文将会简单分析GIS数据模型转换
审计人员核心价值观是审计文化中最本质的因素,关系着审计行业的发展及其监督作用的发挥。本文从政治经济学角度分析了审计人员核心价值观问题,一是要从促进生产力发展方面考
论述了学习者在听力过程中要了解听的心理过程及听的特点,并提出听力的实践训练和听力能力的培养。
随着奥运会结束,人们所关注的热点会迅速转移。奥运商机已过,奥运行情所带来的快速经济发展将逐渐降温,我区必须针对经济大环境的变化,及时调整体育产业的发展战略。本文从奥运会
运用三维造型软件Solid Works构建了双立柱堆垛机三维实体模型,将该模型导入到ADAMS中建立双立柱堆垛机的虚拟样机模型,利用多体系统动力学原理对运动过程进行仿真分析。仿真