论文部分内容阅读
从自然场景中高效提取感兴趣的重要信息是计算机视觉必须解决的问题,人类视觉系统是借助视觉注意机制来处理这一问题,其中涉及特征整合、视觉搜索与注意力转移、时空信息整合、局部→整体/整体→局部的整合等人眼感知机理。人眼不仅能实现高效环境整体感知,同时又具备观测局部精细特征的能力。人脑中的整体与局部信息的整合机制尚不清楚,是有待深入探索的问题。为了借鉴人眼的这种感知能力,本文从整体与局部感知及其整合的角度探讨了图像中显著性物体的检测问题。(1)基于多级特征融合的整体感知显著性物体检测。为了融合底层细节特征和高层语义特征来针对显著性物体检测的互补性,采用编码-解码卷积网络作为骨干结构,提出了多级特征融合的整体感知模型。编码器通过逐层卷积将图片中由局部细节到整体粗略的特征提取出来,进而由解码器采取整合操作处理特征,捕捉到显著性物体在图像中存在的可能性。整体融合感知图是通过叠加操作进行融合,实现整体感知显著性物体检测。在公开的数据中的测试结果表明,多级特征的融合提升了显著性物体的检测准确率,同时该模型也优于其它经典的显著性物体检测模型。该模型同样可以用于焦点预测,测试表明,其性能在SIM、EMD指标上优于经典的视觉焦点预测模型。(2)整体到局部视觉搜索引导的显著性物体检测。为了模仿人眼对物体的关注机制,本文提出基于视觉搜索引导的整合整体和局部感知的显著性物体检测模型。在多级特征融合的得到的整体感知图基础上,为了提高整体与局部感知的整合能力,通过MSER算法,截取前期整体感知图中的局部热点子区域,基于最大响应度的原则生成视觉引导搜索路径,并通过SENet网络逐次融合局部精细感知图,最终得到整合整体和局部感知的显著性物体检测结果。该模型实现了类似人眼观测过程中由粗到细、迭代观测的行为,在显著性物体检测实验中表现出优异的性能。实验测试结果说明在F测度上本文模型优于其它模型,在S指标和MAE指标上也优于或逼近其它经典模型的结果。(3)改善局部边界精细感知能力的显著性物体检测。为了进一步改善显著性物体检测的边界清晰度,引入交叉熵函数、结构相似性函数、交叠率损失函数组合成混合损失函数,从像素-区块-特征图三个层级进行深度监督学习,使得检测得到的显著性物体边界更贴近于真实显著性目标。在六个显著性物体检测数据集的检测结果中,MAE指标都获得了较大提升,说明结构相似性损失函数与交叠率损失函数对于模型的局部边界处理有良好的指导作用,优化了物体边缘检测结果。本文从整体与局部感知及其整合的角度,研究了基于多级特征融合的整体感知显著性物体检测。在引入视觉搜索机制的基础上,提出了基于整体与局部视觉搜索引导的显著性物体检测。在对边界作局部精细感知的前提下,改进了显著性物体检测模型对局部边界精细感知的能力。上述研究是对类人注意机制建模的一种探索式的工作,对该领域相关研究具有较大的借鉴价值。