论文部分内容阅读
视觉跟踪是当前计算机视觉领域中一个热点研究主题,在智能视频监控、机器人导航、智能交通以及国防安全等领域都有重要的应用。为了满足实际需要,当前的视觉跟踪方法需要处理很多实际问题:如何建立有效的表观模型,在合理地描述目标的同时也能较好地区分背景;如何选取快速高效的跟踪推理算法以满足实时性要求;如何在多目标跟踪时正确关联目标等等。为了解决这些问题,视觉跟踪需要涉及多个理论学科,包括:图像处理、模式识别、概率论与数理统计、最优化理论以及控制理论等。因此视觉跟踪是一个兼具理论价值和实际意义的研究主题。视觉跟踪方法可大致分为两类:确定性跟踪方法和概率跟踪方法。确定性跟踪方法往往先根据目标的视觉特性,建立度量目标和候选目标的相似度的最优函数,进而采用最优化算法迭代地计算目标状态(如位置、大小和方向等)的局部最优值。此类方法具有计算效率高和所依赖的参数较少的优点,但由于容易陷入局部极值而导致跟踪失败。概率跟踪方法首先预测目标的状态,再通过视觉观测模型结合概率方法进行推理来更新目标的状态。目前比较流行的概率跟踪方法是粒子滤波,其优点是能够处理非线性非高斯系统、跟踪稳健,但计算效率较低,并且对参数依赖较多。为了改进确定性跟踪算法,需要做的工作包括:如何建立合理的目标模型及其相似性度量方法,以及如何理论推导基于相似度模型的最优化方法。基于此,本文提出以下创新:1.针对基本的mean shift跟踪算法由于无法融入目标的空间信息从而造成目标跟踪的不够精确以及无法处理目标被部分遮挡的问题,采用多个图像子块描述目标,给出了目标与候选目标的相似性度量函数,并基于此推导了类mean shift迭代算法。通过真实实验序列证明,算法能够对目标的尺寸和位置给出较为精确的跟踪结果,并能够较好地处理部分遮挡问题。2.提出了“微分结构相似度”跟踪方法。该方法以结构相似度为相似性度量函数,基于此推导其关于目标状态(位置和尺寸)的梯度,并基于最速下降法的最优化方法给出合理的跟踪方法。算法的跟踪结果精确,能够有效地处理目标的尺寸变化,并且能够在光照发生变化时仍然能够准确地跟踪目标。对于基于粒子滤波的跟踪算法,如何提高采样效率和如何解决多目标跟踪发生遮挡时的推理策略是两个重要的问题,本文针对这两个问题所作的创新有:1.提出粒子滤波框架下基于两层表观模型的跟踪算法。采用颜色/灰度直方图作为“粗糙”模型,应用mean shift算法将每个粒子移位到局部最优位置;采用本征空间模型作为“精确”模型,用来计算每个粒子的权重,以估计目标最终状态。算法克服了粒子滤波跟踪时粒子集中的无效粒子过多,采用较少的粒子数,并同时融合了颜色/灰度特征与目标的本征空间模型,在处理旋转、变光照、变姿态等问题上有较好的效果。2.针对前视红外成像的特点,提出基于显著性检测和两步采样的红外目标跟踪算法。在红外前视图像中,要跟踪的目标往往在图像中都是“显著”的,基于此,本文先在显著性检测的结果上建立显著性观测模型,再将本征空间模型作为另一个观测模型,两个模型通过两步采样算法进行结合。该算法跟踪结果准确,能够处理红外跟踪时目标外观变化,以及由于传感器自运动造成的目标位置突变等问题。3.针对多目标跟踪问题,采用马尔可夫随机场建立概率图模型,在均值场蒙特卡罗方法的基础上,提出基于核密度估计的均值场蒙特卡罗方法。多目标跟踪时,相似目标之间的遮挡会造成跟踪器关联错误,均值场蒙特卡罗方法通过目标之间的限制关系,结合均值场推理方法可以很好地解决关联问题。但算法由于建议分布的不准确,会造成大量粒子无效,为此通过结合基于mean shift的核密度估计方法,能够很好地改善这个问题。该算法在红外序列以及头部跟踪中得到了成功的应用。