论文部分内容阅读
视觉注意是指人在面对复杂场景时,会迅速将注意力集中在少数重要区域,并利用有限的处理能力对其优先处理。而目前许多图像处理任务在处理复杂场景时要浪费大量时间与计算能力。因此将视觉注意机制进行建模并引入计算机图像处理过程有着重要的意义。本文首先详细介绍了视觉注意的生理基础,沿着视觉通路一一介绍与视觉相关的生理结构。接下来介绍了几种重要的自顶向下的视觉注意算法。包括严格按照生理结构建模的、应用最广泛的Iiit模型;效率最高的谱剩余算法;对谱剩余进行扩展的PQFT算法;以及最新、效果最好的全局对比度算法。然而这些算法都有各自的缺点。例如Itti算法的效率不高、谱剩余算法没有利用颜色信息、谱剩余和PQFT算法倾向于提取物体轮廓、全局对比度算法无法处理复杂纹理的背景等等。最后本文提出了新的显著区域检测算法。该算法的设计目标是:1.能够均匀地突出整个显著区域,而不是仅仅突出显著目标的边缘或者轮廓。2.能够从纹理复杂的背景中检测目标。3.计算效率比较高,才能够适应大规模图像处理和高效的图像检索与分类的应用需求。经过分析,本文提出了基于频域与空间域分析的显著区域检测算法。我们认为图像中不引起视觉注意的背景多为重复性出现,因此在幅度谱中表现出较为锋利的尖刺。该算法利用中值滤波器,将幅度谱中的尖刺结构去除,从而实现了抑制重复出现的背景。对于中值滤波器的窗口大小选择问题,本算法先计算出不同窗口大小的滤波结果,将这些结果都转换为空间域的显著图,然后再利用空间标准差来确定候选显著图,最后利用对比函数选择最佳显著图。该算法充分利用了图像的亮度与颜色信息,同时还利用了全局对比算法对结果进行改善。本算法的频域处理方法可以实现复杂背景中检测目标,而且效率较高,同时空间域的分析可以克服频域处理倾向于突出目标边缘的缺陷,使得整个显著物体均匀突出。所以实现了算法的设计目标。最后本算法在经典的MSRA显著目标数据库,以及目前最大的显著目标精确标记数据库上进行了实验,同时与其他10种经典的视觉注意算法进行了对比。结果显示本文提出的算法无论是精确率、召回率、F-测量,还是ROC曲线下面积,都超过了现有的算法,得到了目前最佳的结果。