论文部分内容阅读
注意选择机制是人类视觉感知的一个重要特性。近年来,视觉注意在生理学、心理学、神经科学以及计算机视觉方面得到了广泛研究。它对于基于内容的图像检索、分割以及显著性目标检测有非常重要的指导意义。为了探索人类视觉注意机制的计算模型构建方式及其应用,本文的具体贡献如下所示:首先,回顾了自底向上和自顶向下两类视觉注意模型的研究现状。介绍了视觉注意模型在图像分割以及目标检测方面的应用。通过对人类视觉注意的深入研究发现,视觉显著图比原始输入图像在对待分割区域的预测及目标检测方面具有更强的指示作用,因此对视觉显著区域进行图像分割以及基于显著图和预测视点的目标检测更有助于对图像内容的理解。其次,提出基于联合空域和特征域信息的视觉注意模型的显著对象提取方法。将自底向上的视觉注意模型与mean-shift分割算法结合起来,通过将图像局部区域的显著性均值与全图显著性均值进行比较,实现显著性对象的提取。本文在公开测试集上的测试结果表明:相比现有许多基于其他几种知名的注意模型的目标提取方法,所提出的方法无论是在直观效果还是在正确率和召回率方面都具有显著优势。本文将该方法在知名的行人检测数据库上进行了测试。结果表明,将行人作为显著性对象进行提取时,本文方法同样取得了较好的直观效果。再次,在联合空域和特征域信息的视觉注意模型基础上,添加自顶向下的目标信息及上下文信息,并将三种因素有机融合起来,构建出一个基于视觉注意机制的行人检测模型。实验结果表明,目标信息起到了明显的主导作用,并且三个因素融合的模型比单一因素或者某两个因素融合的模型预测能力更强。所提出的方法在执行行人检测过程中生成的视点分布和眼动轨迹更接近真实眼动数据,且检测结果相比现有行人检测方法具有更高的准确率。