论文部分内容阅读
物体显著性研究是计算机视觉领域的热点问题之一,模拟人眼视觉注意特性的显著区域提取方法是其中一条重要的研究途径。目前为止,针对静态图像已有较为成熟的显著区域提取方法进行处理。对于视频,人的视觉系统有一个重要的特点,不仅需要考虑物体的静态显著度(如亮度、颜色、与周围物体对比度),而且需要考虑物体的运动显著度。如何设计物体显著区域提取方法,从而接近甚至达到人眼视觉注意性能,仍然具有挑战性。视觉研究本身是一个跨学科领域的问题,涉及到计算机视觉及神经生物学这两个截然不同的学科。本论文研究视觉注意特征和物体显著性提取算法,主要从计算机视觉这一角度出发进行阐述,内容上,本论文就近年来在此领域内的进展作一综述,并着重分析自底向上的显著性提取模型;而后以计算机视觉的语言详细解析视频中物体的运动显著性和静态图像中物体的显著性,设计和提出了基于视觉注意机制的物体显著性提取算法,并完成了相关实验。实验结果表明了这种物体显著性提取方案的可行性。本论文的主要工作和创新点包括以下几个方面:1.研究和比较了视觉注意领域内的物体显著性提取模型和算法,并分析其优缺点。2.基于视觉注意特征,提出视频中物体的运动显著性提取算法。首先对视频进行分割,对于一组连续的视频帧序列,通过块匹配算法得到运动向量表示,然后从视频帧中提取区域显著特征,接着给出基于运动向量的运动显著性提取算法,建立算法的基本框架。3.研究静态图像中物体显著性的提取方法,分析了谱残余算法和增量编码长度算法的流程。相对于传统特征提取方法得到的静态显著图,谱残余算法更加明显地突出显著区域,增量编码长度算法具有一定的神经生物仿生依据。4.从视觉注意机制上考虑视频中物体的整体显著性,分析了运动显著性和静态显著性对视觉注意的影响,提出通过混合准则构成物体的整体显著性,给出了合成方法。计算机实验结果显示提出的算法有不错的效果。