论文部分内容阅读
人类视觉系统处理较为复杂的场景时,会将其视觉注意力集中于该场景的少数几个对象,并将这些对象优先处理,力求在最短时间获取场景中的主要信息,此过程称为视觉注意过程,这些对象在场景中构成的区域即为感兴趣区域(region of interest, ROI)。提取图像的ROI可大大降低图像处理时的计算量,有效提高信息处理的效率。图像ROI的提取分析与研究对图像压缩与编码、图像检索、目标检测与识别、场景分析和主动视觉等领域有着极高的应用价值。本文围绕图像ROI的提取问题,分别从眼动实验数据、图像底层特征、视觉注意模型和高层语义等方面结合起来进行研究,主要工作如下。(1)提出了一个基于眼动数据的图像ROI提取算法。设计眼动实验,并利用眼动仪获取被试者的眼动数据,经数据筛选和坐标变换等处理后得到有效的注视数据,通过高斯分布模拟、“标记山头法”寻找注意焦点和种子填充等过程提取有效被试者的眼动ROI,将提取到的眼动ROI作为图像真实的ROI,用以评判其它方法得到的ROI的效果。(2)以颜色特征为基础,研究多个底层特征结合视觉注意对ROI提取的影响,提出了颜色特征的ROI提取和底层特征最佳权重等2个算法:一是根据颜色理论设计饱和度等8种颜色特征,融入视觉注意模型,获取计算显著图,对比眼动数据生成的显著图,设计优化颜色特征选择规则和图像分割算法,实现ROI自动精确提取。是结合颜色、亮度、方向和纹理等四种底层特征,对眼动ROI和基于图像底层特征提取的ROI区域评价,分析四种底层特征对不同类型的图像ROI提取的影响程度,得到底层特征提取ROI时的最佳权重。(3)通过有效类比眼动实验和眼动轨迹,提出了基于显著点和显著区域2个ROI提取算法。针对显著点,从统计学角度出发,结合K-means聚类算法,采用形态学方法检测图像轮廓,将聚类中心作为种子点对图像轮廓图进行种子填充,并与输入图像掩膜,实现ROI的提取。针对显著区域,利用改进的Grabcut图像分割算法和视觉注意模型生成的显著图,代替用户对输入图像的前景或背景进行指定引导的交互式过程,完成ROI的提取。(4)提出了一种融合自底向上(bottom-up)和自顶向下(top-down)信息的图像ROI提取算法。该算法将观察者携带的观察任务等top-down信息转换为图像底层特征的不同权重值,同时结合Itti和Stentiford两个bottom-up的视觉注意模型,吸取两模型优点,实现观察者所携带的任务与图像视觉刺激相结合的ROI提取。将观察者的查询意图以及对图像的理解转换为显著图权重的方式,即通过对底层特征加以相应权重来影响显著图的求解,缩短了观察者的查询意图与图像底层特征间的鸿沟,提取出来的ROI更符合观察者的要求。