论文部分内容阅读
显著性检测是计算机视觉领域中的热点问题之一,其目的是令计算机具备人类视觉处理信息的能力,使其能够自动找到图像中吸引视觉注意力的区域。经过近二十年的发展,视觉显著性技术取得了长足的进步。对于大多数目标内部特征趋于一致且背景比较干净的图像,现有的显著性检测技术取得了令人满意的效果,但是复杂场景下的显著性检测仍然面临着许多挑战。 本文主要针对自然图像的显著性目标检测与显著性融合两个方面展开研究,主要的研究成果包括: (1)本文提出了一种基于双结构化核范数的矩阵分解模型(DSNMD)用于显著性目标检测。在DSNMD模型中,第一次引入了树结构的核范数(TSN)概念分别刻画感兴趣目标区域和背景区域潜在的结构信息,包括全局结构、局部结构以及每个树结点的内部结构。TSN同时具备了核范数以及与稀疏相关范数在显著性目标检测中的优点。此外,高层先验信息被嵌入到DSNMD模型中,进一步提高了显著性目标检测的性能。实验结果表明,该方法优于目前其它非监督的显著性目标检测方法,与监督的方法具有高度可比性。 (2)基于图像分类框架,本文提出了一种基于空间约束编码的自顶向下的显著性目标检测方法,其结果是产生针对特定目标类别的显著图。该方法将空间信息引入到特征编码中,建立了一种简单有效的局部约束上下文编码方法(LCCC),使得只有来自于相同语境的超像素才具有相似的码字并以此提升其判别能力。此外,为了进一步使用到特征的局部语境信息,提出了一种多尺度的上下文汇聚方法。结合LCCC编码方法和上下文汇聚策略后得到的特征表示具有更强的判别能力,从而使得本文提出的自顶向下的显著性目标检测方法更具鲁棒性。最后,使用图像的似物性检测结果对得到的自顶向下的检测结果进行显著性增强。实验表明,相比于现有的方法,该方法可以产生更加准确的显著性检测结果。 (3)通过分析现有显著性检测算法的结果可以得到两点结论:第一,不同显著性检测方法对于同一副图像的检测结果不同;第二,这些结果在一定程度上可以优势互补。基于此,本文提出了一种基于稳健主成分分析的显著性融合方法,旨在得到一个性能优于所有单个显著性检测方法的融合结果。该方法把显著性融合转化为一个低秩矩阵恢复问题,并使用经典的稳健主成分分析模型(RPCA)进行低秩矩阵恢复。实验结果表明,所提出的融合方法能够继承不同显著性模型的优点,得到一个更加准确的显著目标检测结果。显著性融合方法的提出为显著性检测方法的研究提供了一个崭新的视角。 (4)本文在基于稳健主成分分析的显著性融合方法的基础上,建立了一个双低秩的矩阵恢复模型(DLRMR)用于显著性融合。DLRMR与RPCA相比,相似的地方在于,两个模型都假设背景区域对应的显著性特征矩阵是低秩的。两个模型关键的差别在于对目标矩阵的刻画上。RPCA假设在显著性特征空间中目标矩阵是稀疏的,DLRMR则认为目标矩阵是低秩的。实验结果表明,基于DLRMR的显著性融合方法优于基于RPCA的融合方法。此外,本文提出了一种显著性模型选择策略,在很大程度上降低了融合算法的计算复杂度。