论文部分内容阅读
基于生物视觉机制的场景识别是通过模拟人类的感知能力来挖掘图像中的场景特征,进而推断出图像间的类别关系,从而自动地识别出图像所隶属的场景。由于场景识别技术可以有助于解决目标跟踪与定位、视频内容分析、图像智能检索和视觉机器人导航等一系列具有代表性的计算机视觉及模式识别领域的应用问题,所以场景识别成为该领域中非常活跃和富有挑战性的研究课题之一,受到了国内外研究者的广泛关注。本文针对基于生物视觉机制的场景识别的关键问题展开研究,主要研究内容及成果主要体现在以下几个方面:研究人类视觉系统的注意力选择机制及显著性检测模型的原理,分析并对比空域检测模型和频域检测模型的内在机理与性能。提出了一个将SR、PFT及PQFT为代表的频谱检测模型囊括其中的统一的基于幅度谱调制的视觉显著性检测算法框架。在此基础上,提出了基于幅度谱均衡调制的ASBM模型,在一定程度上解决传统算法在特定条件下的检测不准确问题。仿真实验证明,本文提出的ASBM模型在检测的准确性,鲁棒性以及抗噪能力方面均优于该领域中性能较好的PQFT模型,因此使视觉显著性检测算法得到进一步优化。针对光照变化给视觉显著性检测及场景识别带来的问题,研究基于颜色恒常性理论的图像增强算法,重点分析了经典的多尺度Retinex算法的原理,并指出其采用的高斯滤波所存在的不足,提出了基于鲁棒各向异性扩散的改进多尺度Retinex算法,从而在一定程度上解决了传统方法存在的边缘伪增强问题,能够进一步保护具有场景分析价值的边缘信息,并将改进的算法应用于颜色恢复。对比实验证实,该算法在得到较好的颜色恢复效果同时,还能获取更清晰的边缘信息,为具有场景代表性的区域分割以及局部稳定特征提取工作提供必要的保障。研究了基于图像内容表征的场景识别方法,提出了快速的基于视觉显著性的场景代表性区域分割框架,在一定程度上解决传统的面向场景识别的图像处理方法需要遍历整幅图像所带来的计算低效率问题。其中,基于熵优先策略的区域提取算法通过计算显著点的邻域信息熵来确定场景代表性区域中心,实验证明该算法具有较好的鲁棒性和抗噪性,并且提取到的区域与局部不变兴趣点之间存在较好的场景一致性。而基于先验知识的显著建筑物分割算法可以实现建筑物区域信息在图像像素级上的精确检测,并将其应用于室外场景数据集。与其他方法相比,该分割算法不仅能够检测到图像中建筑物的存在,还可以提取其细致的区域信息,并在去除非遮挡干扰目标的同时还能去除遮挡建筑物的干扰目标。研究局部不变特征描述子的特点及构造过程,并通过对比分析选择了性能较好的SURF算法作为重点研究及使用目标,提出了基于多方向融合的主方向定位算法,能够获得比SURF算法更好的主方向定位结果。提出了基于兴趣点强度、对比度及微小尺度子空间的兴趣点密度的相似兴趣点竞争策略,进一步去除了兴趣点中的噪声点,从而提高了局部特征的匹配准确率及目标的识别效率。研究现有场景识别方法的特点及流程,结合本论文课题研究的划分粒度较小的固定场景识别问题,选择了本论文提出的具有较好性能的ISURF特征,并利用前面得到的场景代表性区域的分割结果来有效地缩减ISURF特征的待搜索空间,降低了算法的计算复杂度与计算时间。针对图像局部特征所带来的三层类别归属关系,设计了基于场景分析机制和竞争机制的IHDR树状分类器,并提出了基于ISURF特征与IHDR树的场景识别方法。实验结果表明,该方法在分类与识别结果和平均计算时间上均取得了较好的效果。