论文部分内容阅读
随着信息科学技术的发展,越来越多的数字化设备被应用于工作和生活中来记录和传播信息,进而使得照片和视频资源呈现几何级数的增长。如何快速从海量的视觉媒体信息中筛选出有效的信息成了视觉信息处理领域的热点课题。视觉显著性检测尝试模拟人类的视觉机理,自动检测和定位人类感兴趣的图像和视频区域,为快速处理视觉数据提供了可能。本文在深入分析国内外显著性检测研究成果之后,发现现有模型在复杂场景下的表现不尽如人意,例如背景中重复出现的鲜艳小结构容易被检测为前景目标,显著物体拥有多种特征区域时只有部分区域被检测出来,背景物体比前景物体颜色更加鲜艳时容易把背景检测成前景,前背景相似时导致前背景边界不清晰。面对以上复杂场景,本文针对简单特征空间不足以反映像素差异和传播算法缺乏全局信息及背景先验不可靠的问题进行研究,主要的研究内容和创新点如下:1.构建了一个适合复杂场景的高维特征空间。针对现有算法简单使用颜色空间作为特征空间从而导致在复杂场景下难以区分不同超像素的细微差异的现象,本文提出建立一个高维特征空间,尝试使用更多的特征来描述超像素,包括CIELab颜色空间,颜色直方图,纹理空间,基于轮廓检测和似物性采样的物体完整性特征和基于深度卷积网络的高层语义信息。基于将显著物体的轮廓与内部完整地从背景中突出的目的,物体完整性特征充分利用了轮廓检测对于物体边界的界定作用和似物性采样对于物体的识别作用,将位于显著物体轮廓边缘的像素级的显著值传播到显著物体内部。基于深度卷积网络的高层语义信息是为了界定图像中哪一个物体是人类感兴趣的显著物体。2.改进了现有的传播模型。目前的传播模型缺乏全局信息以及对于背景先验知识的处理过于简单,直接将图像四周当作背景或者四条边筛选三条作为图像的背景又或者简单使用颜色对比来去除对比度高的像素,当显著物体触及多条边界或者图像相对杂乱时,算法性能较差。本文通过边界筛选,边界连接和引入汇点三方面来改进完善。边界筛选是为了将图像边界中可能属于前景的超像素剔除掉,为传播算法提供更准确的背景先验种子点;边界连接是将超像素与筛选过后的边界像素连接,为传播算法提供全局信息;引入汇点是为传播过程提供稳定的背景参考点。本文算法在七个公开的显著物体检测数据库进行实验,并且与十种经典和先进的算法进行定性和定量的分析。本文算法在准确率-召回率曲线,ROC曲线,F-measure曲线以及平均绝对误差MAE四个指标上与改进前的算法相比性能有着大幅度的提升,且将本文得到的高维特征空间应用于其他算法上,性能也有着显著的提升。