论文部分内容阅读
伴随着人类对自然科学的探索,视觉上的观测始终发挥着重要作用。然而,图像在获取和显示等过程中,由于成像设备和成像原理固有的局限性和其他外界因素的影响,在采集图像的过程中会产生模糊和噪声,导致图像质量下降,产生纹理细节和特征等有用信息难以准确提取或完全缺失的降质图像。这种情况,会给之后的图像分析和图像理解阶段带来直接的负面影响。因此,图像模糊的处理――包括图像的模糊检测、估计和图像去模糊,自诞生之日起,便受到了广泛的研究与关注。图像的模糊处理是指利用算法的手段,对图像的模糊进行检测、分析、估计和去除等操作,目的是从多幅或单幅模糊退化的图像恢复出高品质的图像。随着机器视觉和计算机视觉等应用对图像品质的超高要求,图像的模糊处理正越来越多的发挥着更加积极的作用,因而,在图像处理领域中,也受到越来越多的关注。
现有图像的模糊处理方法可以概括为两类:数据驱动的方法和模型驱动的方法。数据驱动的方法与人类的认知过程具有很大的相似性,需要利用大量具有重大意义的特征数据进行训练。它与人类认知过程不同之处在于,我们需要手动的选择具有重要特征的数据、确定重要特征的意义以及确定所需要特征的种类等等,这会直接影响基于数据驱动的算法的稳定性;而模型驱动的方法,往往过度依赖先验知识来约束最优解空间,限制了模型驱动方法的应用,影响其性能和精度。为了改善图像的模糊处理方法的性能,将这两类方法进行结合是一种选择。
稀疏表达模型是一种强大的统计模型,已经被广泛地应用于许多图像模糊处理的应用和研究之中。本文基于稀疏表达的理论,围绕数据驱动方法与模型驱动方法的关联问题开展研究。以单幅图像的图像模糊处理为主要研究内容,分析自然图像的普遍规律,挖掘非局部的结构特性,为基于稀疏表达的图像模糊处理方法提供新的思路。
本文的主要研究内容和创新成果如下:
1)针对过完备字典表达模式的局限性和稀疏系数分布估计不够准确的问题,提出一种基于稀疏表达的改进模型,来检测和估计由图像传感器采集到的散焦模糊。我们考虑到一个事实,即在不同图像中或单幅图像的不同图像块中的模式通常变化十分巨大,而利用一个过完备字典来进行稀疏表达是十分不稳定且耗时的。针对这个问题,提出利用自适应域选择方案来事先学习一组紧凑字典集合,并为每一个待处理的图像块自适应地选取一个最优的表达字典。之后,利用非局部的结构相似性学习与真实系数分布更加接近的非零均值的系数分布。由此,我们可以获得更加准确的稀疏系数,并进一步提高散焦模糊检测与估计结果的性能。为了估计模糊的程度,提出了一种模糊强度估计的度量标准。实验结果证明,提出的方法在定量和定性上,都优于当前流行的散焦模糊估计算法。
2)针对解空间约束不足的问题,提出了一种基于低秩正则化的稀疏表达模型,实现单幅图像的去模糊问题。提出方法的动机源于对于自然图像的一种观测,图像包含大量自重复性的结构,它们可以通过相似的模式进行表达。然而,由于输入图像包含模糊、噪声和其他退化效应,仅仅用块聚类算法提取非局部的相似结构是不够的。我们首先提出一种集成字典学习的方法,表达不同的相似模式;之后,将低秩正则化约束直接作用于输入图像块上,指导期望的解空间朝着尖锐的图像结构发展。并利用核范数和l1范数优化目标函数。对比实验结果证明,提出算法可以在视觉品质和量化指标上,取得更好的结果。
3)针对有用信息利用不足的问题,提出了一种基于稀疏表达和梯度先验知识的尺度自适应选择方法。使用一个预训练的模糊字典,稀疏表达可以利用一幅模糊的输入图像,稀疏地重建模糊样本。利用最小化方法求解最小数量的模糊原子获得初始位置对应的稀疏系数向量,定位到该选择区域的初始位置(是一个图像块),寻找到表达光滑组成的最佳样本。再利用一种梯度先验知识搜索一系列扩大的离散尺度。提出的算法结合稀疏表达和有用特征的统计特性,可以使区域选择方法高度有效。针对不同的区域选择算法,提出的算法在模糊核估计和图像去模糊的品质上都取得了更好的性能。
现有图像的模糊处理方法可以概括为两类:数据驱动的方法和模型驱动的方法。数据驱动的方法与人类的认知过程具有很大的相似性,需要利用大量具有重大意义的特征数据进行训练。它与人类认知过程不同之处在于,我们需要手动的选择具有重要特征的数据、确定重要特征的意义以及确定所需要特征的种类等等,这会直接影响基于数据驱动的算法的稳定性;而模型驱动的方法,往往过度依赖先验知识来约束最优解空间,限制了模型驱动方法的应用,影响其性能和精度。为了改善图像的模糊处理方法的性能,将这两类方法进行结合是一种选择。
稀疏表达模型是一种强大的统计模型,已经被广泛地应用于许多图像模糊处理的应用和研究之中。本文基于稀疏表达的理论,围绕数据驱动方法与模型驱动方法的关联问题开展研究。以单幅图像的图像模糊处理为主要研究内容,分析自然图像的普遍规律,挖掘非局部的结构特性,为基于稀疏表达的图像模糊处理方法提供新的思路。
本文的主要研究内容和创新成果如下:
1)针对过完备字典表达模式的局限性和稀疏系数分布估计不够准确的问题,提出一种基于稀疏表达的改进模型,来检测和估计由图像传感器采集到的散焦模糊。我们考虑到一个事实,即在不同图像中或单幅图像的不同图像块中的模式通常变化十分巨大,而利用一个过完备字典来进行稀疏表达是十分不稳定且耗时的。针对这个问题,提出利用自适应域选择方案来事先学习一组紧凑字典集合,并为每一个待处理的图像块自适应地选取一个最优的表达字典。之后,利用非局部的结构相似性学习与真实系数分布更加接近的非零均值的系数分布。由此,我们可以获得更加准确的稀疏系数,并进一步提高散焦模糊检测与估计结果的性能。为了估计模糊的程度,提出了一种模糊强度估计的度量标准。实验结果证明,提出的方法在定量和定性上,都优于当前流行的散焦模糊估计算法。
2)针对解空间约束不足的问题,提出了一种基于低秩正则化的稀疏表达模型,实现单幅图像的去模糊问题。提出方法的动机源于对于自然图像的一种观测,图像包含大量自重复性的结构,它们可以通过相似的模式进行表达。然而,由于输入图像包含模糊、噪声和其他退化效应,仅仅用块聚类算法提取非局部的相似结构是不够的。我们首先提出一种集成字典学习的方法,表达不同的相似模式;之后,将低秩正则化约束直接作用于输入图像块上,指导期望的解空间朝着尖锐的图像结构发展。并利用核范数和l1范数优化目标函数。对比实验结果证明,提出算法可以在视觉品质和量化指标上,取得更好的结果。
3)针对有用信息利用不足的问题,提出了一种基于稀疏表达和梯度先验知识的尺度自适应选择方法。使用一个预训练的模糊字典,稀疏表达可以利用一幅模糊的输入图像,稀疏地重建模糊样本。利用最小化方法求解最小数量的模糊原子获得初始位置对应的稀疏系数向量,定位到该选择区域的初始位置(是一个图像块),寻找到表达光滑组成的最佳样本。再利用一种梯度先验知识搜索一系列扩大的离散尺度。提出的算法结合稀疏表达和有用特征的统计特性,可以使区域选择方法高度有效。针对不同的区域选择算法,提出的算法在模糊核估计和图像去模糊的品质上都取得了更好的性能。