论文部分内容阅读
针对自然图像的显著性检测问题由来已久。视觉显著性检测的概念,目前科研领域尚未给出明确定义,一般认为,基于计算机视觉技术有效地模拟人类视觉系统的工作原理,高效地定位并识别自然图像中的感兴趣区域或目标,将此过程定义为视觉显著性检测(或显著性检测)。与工业图像最大的差别在于,自然图像中的背景和显著性区域无法根据先验知识获取,这为显著性检测过程增加了难度。本文研究目的在于对自然图像中的显著性区域进行高效检测,一定程度上实现模拟人类视觉的任务。对一些基本应用,如遥感定位,目标跟踪,医学影像等有着重要意义。近年,有关显著性检测的新方法层出不穷。从研究思想上可大体分为两类:横向分析思想:利用图像中背景与目标的特征进行区分,通过结合边缘,纹理,颜色等有效信息加以区分,从而达到显著性检测的目的;纵向分析思想:利用相关图像组之间的深度信息,挖掘联合显著性对象,从而达到显著性检测的任务。研究方法大体可分为以下几类:1.基于频域变换的分析方法,2.基于图论的分析方法,3.基于机器学习的分析方法等。现有的一些模型只能解决背景和目标相对固定的一些自然图像,而涉及复杂背景下的多目标检测时,由于背景所含信息无法有效描述,或目标信息与背景信息相似度极高,会导致显著性检测失败。本文提出一种基于图的显著性传播算法解决复杂背景下的显著性检测问题。其次,对于RGB图像检测而言,现有的联合显著性检测模型并未考虑图像内部所隐藏的深度信息,本文在充分考虑深度信息的基础上,提出一种迭代的算法框架解决联合显著性检测问题。最后本文利用深度显著性网络与完整图上种子传播相结合的框架提取联合显著性特征,以像素级精度解决显著性目标的精确定位及目标边界模糊等问题。本文的研究内容如下:(1)提出基于二维分数阶Fourier变换的显著性检测模型,弥补频域方法所暴露出的缺陷问题(频域方法仅针对背景颜色变化单一,纹理清晰时较为有效)。定义了噪声敏感度NSS概念来刻画算法的鲁棒性,实验证实了该方法的有效性。同时提出一种改进的比较程序,考虑了边界切割、中心偏差和平滑,为算法对比提供更精确有效的手段;最后采用了心理学模式等对人类眼注特性进行预测。(2)针对复杂背景下显著性检测的问题,本文提出一种判别性的显著性传播算法(DSP),通过在新的特征空间下创建相似性度量来刻画背景与目标之间的关联度,进而生成基于背景先验的粗糙显著性图,再通过显著性传播机制进一步细化得到最终的显著性图。经分析验证,本文所述的框架也同样适用于现有的其他显著性模型并会对性能有所提高。同时该方法在不同的评价指标上具有较好的性能。(3)针对RGBD图像的联合显著性检测问题,本文提出一种迭代的RGBD联合显著性框架,将现有的二维显著性模型转化为RGBD联合显著性形式。该框架具体涵盖三种处理环节:加性环节、减性环节和循环迭代环节。加性环节用于优化单显著性图,并利用一种新的描述符深度先验(DSP)将深度信息引入到框架中。减性环节目的是利用一个公共概率函数来捕获像间的约束并抑制非公共区域,该概率函数表示每个超像素图像属于公共区域的可能性。最后,循环迭代环节以获得更均匀一致的联合显著性图。通过对两组RGBD数据集的综合比较和讨论,证明该方法优于其他显著性模型和联合显著性模型。(4)提出一种改进的联合显著性检测框架用于在一组图像中寻找共同的显著性区域。框架利用深度显著性网络传递联合显著性先验知识以此捕捉高级语义信息,最终实现均匀地刻画公共目标及其对应的边界。