论文部分内容阅读
视频目标跟踪是计算机视觉领域的一个核心问题,在军事制导、视频监控、机器人视觉导航、人机交互、以及医疗诊断等许多方面有着广泛的应用前景。视频目标跟踪的研究目的是使计算机能够模拟人类视觉运动感知功能,并赋予机器辨识序列图像中运动目标的能力,为视频分析和理解提供重要的数据依据。由于实际环境中目标运动存在随机性和复杂性,例如视频序列中运动目标大小的改变、目标运动轨迹的不规则性、目标颜色与背景颜色的相似程度等,因而会给视频目标跟踪带来困难。尽管人们对视频目标跟踪进行了较广泛的研究,并提出了许多适合不同应用背景的跟踪方法,但是目前仍存在许多问题和难点尚未解决。因此,研究复杂背景下的目标跟踪不仅具有重要的理论意义,而且具有广泛的应用前景和很高的实用价值。本论文在研究现有计算机视觉算法的基础上,针对智能监控和人机交互系统背景固定视频序列中的运动目标,特别是人体和车辆等目标的运动跟踪和识别问题展开研究,提出了一些用于运动目标跟踪与识别的新算法。本论文的主要研究内容和成果如下:1.针对智能监控系统中运动目标的跟踪问题,提出了一种基于加窗粒子滤波的轮廓线跟踪的改进算法。目标的轮廓用B样条曲线表示,利用加窗粒子滤波算法跟踪轮廓线的运动。在基本粒子滤波算法的基础上,采用窗口滤波更新粒子集合,根据对目标轮廓位置估计的情况动态更新粒子集合的大小。该算法利用估计窗内的混合抽样粒子集描述后验分布,对估计窗内具有不同权值的粒子集依据其权值大小进行抽样,并根据当前时刻目标轮廓观测线上的边缘特征点对抽取的粒子状态进行更新,从而实现对目标的跟踪。这种跟踪算法在不影响跟踪精度的情况下,大大减少了计算量。2.针对复杂环境下的视频目标,提出了一种多信息融合的粒子滤波跟踪算法。该算法将颜色和运动这两种信息融合进粒子滤波器,并提出分层抽样的方法,克服了利用单一信源所带来的跟踪不稳定问题,并能有效解决由于目标形状或颜色模糊而产生的跟踪困难问题。该粒子滤波融合算法在复杂背景下能够稳健可靠地跟踪目标。3.针对人机交互系统中的动态跟踪以及识别问题,提出了一种基于运动轨迹的行为跟踪和识别算法。该算法首先通过一种称为连续自编码网络(Continuous Autoencodernetwork,C-Autoencoder)的双向深层神经网络将高维轨迹嵌入到二维平面上,并由连续自编码网络的逆向映射获得高维轨迹的生成模型,接着从上述轨迹生成模型中产生一系列可行性轨迹,即样本轨迹。跟踪算法中,粒子滤波器当前时刻的粒子便从这些样本轨迹相应的位置点进行抽取,利用颜色似然函数对抽取的粒子进行加权以及再抽样,从而实现对目标状态的估计。识别算法中,引入一种改进的Hausdorff距离来计算当前轨迹估计值与截断的轨迹模板之间的相似性,从而实现对跟踪轨迹的识别。该算法的优点在于对目标的行为能够有效地进行边跟踪边识别,当前时刻的跟踪结果用于行为轨迹的识别,而轨迹识别的结果又可以指导下一时刻的跟踪。