论文部分内容阅读
在各种图像分析和处理过程中,人们感兴趣的区域通常不是图片的所有内容,而是只是图像的一部分,因此,有大量研究者关注于人类视觉注意机制,并提出了一些计算模型,例如,Laurent Itti等人提出的视觉注意计算模型。视觉注意计算模型以解剖学、神经心理学、认知科学等领域的研究成果或理论为基础,利用数学模型模拟人类的视觉感知系统,是目前数字图像处理和计算机视觉等相关方向的研究热点。视觉注意计算模型将存在待检测目标的人眼感兴趣区域视为图像中某些特征显著的像素点的集合,通过寻找图像中的显著点来检测感兴趣区域。在图像检索、目标检测、场景监控、图像缩放等众多图像处理任务中,通过视觉注意计算模型检测出图像中的感兴趣区域,将系统资源集中于此类区域进行计算分析,相比于对图像中所有区域赋予相同优先级的处理方法,降低了处理过程的计算量,为后续的处理提供很大的便利。本文以视觉注意的计算模型为出发点,阐述了显著区域的提取和物体定位技术,给出了一种结合视觉显著度和图像分割的方法,并应用到物体定位技术中。主要贡献有:(1)自底向上视觉显著图计算模型的改进。首先基于人类视觉原理,将图像分解为亮度、颜色和方向三个特征,同时加入弯曲度计算,得到物体的轮廓,获得相应的图像序列,再利用中央-周边(Center-Surround)算子,分别计算各特征显著图。将各个显著图合并,得到综合显著图。然后,采用区域生长分割算法对图像进行分割,得到最终的显著图。改进后的显著图更加突出了图片全局性结构信息。(2)基于视觉显著图的物体定位方法:在视觉显著图的基础上,使用有效子窗口搜索算法得到显著物体位置。把视觉显著性应用于物体定位可以减少计算量,也不需要大量的训练集。