论文部分内容阅读
近年来,随着多媒体技术的迅猛发展,数字图像在各种领域中日益普及,图像处理技术也得到了越来越广泛的应用。本文针对两个重要的图像处理问题:图像卡通纹理分解与图像补全,展开了研究与探讨。其中,图像卡通纹理分解指的是把图像分为包含显著结构的卡通部分和包含重复图案的纹理部分。在运动估计、立体匹配等视觉任务中,常常需要对图像进行分解,以对其卡通部分和纹理部分实施不一样的处理;图像补全则是指将带有信息丢失的图像恢复为清晰的图像,该技术对于图像的椒盐噪声消除、文字去除、划痕去除等问题都有着重要的应用价值。
图像分解和图像补全都是病态问题。稀疏表示是解决此类问题的常用无监督技术之一。本文针对现有方法的缺点与不足,对基于稀疏表示的图像分解和图像补全方法进行研究与创新。对于图像分解,现有的稀疏表示方法往往没有考虑到纹理部分的非局部自相似性。本文针对此问题,设计了一个新的非局部稀疏化系统以同时利用卡通部分和纹理部分的非局部自相似性。在此基础上,本文提出了一个区分性的稀疏表示模型,以对图像进行有效的分解。对于图像补全,现有的稀疏字典学习模型在面对视频、多重谱图像等高维数据时往往表达能力不足或者耗时过长。这些问题在图像张量补全中显得尤为严重。针对以上问题,本文设计了一种卷积合成的字典构造方法,并在此基础上建立了兼具性能与效率的图像补全模型。本文的研究成果和创新点如下:
1)本文提出了区分性的非局部自相似先验。现有的非局部自相似先验大多是针对图像复原设计的,仅考虑到图像块的重复特性,难以对图像的卡通和纹理进行区分。与传统的非局部自相似先验相比,本文提出的先验能进一步考虑到纹理和卡通在非局部结构的方向特性上的差异,即纹理部分的各向同性非局部自相似性和卡通部分的各向异性非局部自相似性。因此,它可以很好地区分纹理部分和卡通部分,使得基于非局部自相似先验的卡通-纹理分解方法不会混淆两个部分的非局部自相似现象。
2)本文提出了一个新的图像卡通纹理分解方法,该方法能够精准地刻画图像非局部结构的方向特性。通过本文提出的带方向图像块匹配和交替图像块堆叠方案,该方法构造的堆叠图像块在空间维度和堆叠维度上具有对偶稀疏性。基于此对偶稀疏性,本文提出了区分性的非局部稀疏表示模型,以刻画卡通和纹理图像块在局部与非局部属性上的差异。实验结果表明,该稀疏表示模型能有效区分图像的纹理部分和卡通部分。
3)本文提出了一个基于卷积合成的张量字典学习模型。与传统的合成型稀疏表示模型相比,该模型使用了分析型模型,具有高效的稀疏表示估计算法;与基于图像块的模型相比,该模型使用了卷积稀疏表示,能保持图像像素的一致性。与正交字典学习模型相比,该模型对因子字典进行正交约束,既能得到过完备的字典以保证模型的表达能力,又具有正交约束带来的高效字典更新算法。与现有的基于分解的字典学习模型相比,该模型使用卷积分解,能避免秩为1的约束,并学习到带方向的字典原子。
4)本文提出了一个基于张量字典学习的图像张量补全方法。现有的低秩图像张量补全方法往往没有充分利用图像丰富的局部结构。现有的字典学习模型则由于其有限的效率及表达能力,难以直接应用于图像张量补全。本文提出的图像张量补全方法基于卷积合成的张量字典学习模型,能充分地利用图像的局部结构。在多个数据集上的实验表明,本文提出的方法不但优于基于传统字典学习的方法,还优于结合低秩近似和字典学习的补全方法。
本文的研究成果对稀疏编码和字典学习技术的发展具有重要意义,同时能为稀疏表示的理论、模型和算法提供思路。
图像分解和图像补全都是病态问题。稀疏表示是解决此类问题的常用无监督技术之一。本文针对现有方法的缺点与不足,对基于稀疏表示的图像分解和图像补全方法进行研究与创新。对于图像分解,现有的稀疏表示方法往往没有考虑到纹理部分的非局部自相似性。本文针对此问题,设计了一个新的非局部稀疏化系统以同时利用卡通部分和纹理部分的非局部自相似性。在此基础上,本文提出了一个区分性的稀疏表示模型,以对图像进行有效的分解。对于图像补全,现有的稀疏字典学习模型在面对视频、多重谱图像等高维数据时往往表达能力不足或者耗时过长。这些问题在图像张量补全中显得尤为严重。针对以上问题,本文设计了一种卷积合成的字典构造方法,并在此基础上建立了兼具性能与效率的图像补全模型。本文的研究成果和创新点如下:
1)本文提出了区分性的非局部自相似先验。现有的非局部自相似先验大多是针对图像复原设计的,仅考虑到图像块的重复特性,难以对图像的卡通和纹理进行区分。与传统的非局部自相似先验相比,本文提出的先验能进一步考虑到纹理和卡通在非局部结构的方向特性上的差异,即纹理部分的各向同性非局部自相似性和卡通部分的各向异性非局部自相似性。因此,它可以很好地区分纹理部分和卡通部分,使得基于非局部自相似先验的卡通-纹理分解方法不会混淆两个部分的非局部自相似现象。
2)本文提出了一个新的图像卡通纹理分解方法,该方法能够精准地刻画图像非局部结构的方向特性。通过本文提出的带方向图像块匹配和交替图像块堆叠方案,该方法构造的堆叠图像块在空间维度和堆叠维度上具有对偶稀疏性。基于此对偶稀疏性,本文提出了区分性的非局部稀疏表示模型,以刻画卡通和纹理图像块在局部与非局部属性上的差异。实验结果表明,该稀疏表示模型能有效区分图像的纹理部分和卡通部分。
3)本文提出了一个基于卷积合成的张量字典学习模型。与传统的合成型稀疏表示模型相比,该模型使用了分析型模型,具有高效的稀疏表示估计算法;与基于图像块的模型相比,该模型使用了卷积稀疏表示,能保持图像像素的一致性。与正交字典学习模型相比,该模型对因子字典进行正交约束,既能得到过完备的字典以保证模型的表达能力,又具有正交约束带来的高效字典更新算法。与现有的基于分解的字典学习模型相比,该模型使用卷积分解,能避免秩为1的约束,并学习到带方向的字典原子。
4)本文提出了一个基于张量字典学习的图像张量补全方法。现有的低秩图像张量补全方法往往没有充分利用图像丰富的局部结构。现有的字典学习模型则由于其有限的效率及表达能力,难以直接应用于图像张量补全。本文提出的图像张量补全方法基于卷积合成的张量字典学习模型,能充分地利用图像的局部结构。在多个数据集上的实验表明,本文提出的方法不但优于基于传统字典学习的方法,还优于结合低秩近似和字典学习的补全方法。
本文的研究成果对稀疏编码和字典学习技术的发展具有重要意义,同时能为稀疏表示的理论、模型和算法提供思路。