论文部分内容阅读
视频目标跟踪是计算机视觉系统的核心任务之一,在智能视频监控、人机交互、医学诊断、机器人导航等众多领域有着广泛的应用前景。然而,在实际复杂立用场景中,光照、阴影、遮挡、运动突变、背景混乱等各种因素给视频目标跟踪技术带来了极大的挑战。论文针对复杂场景下高效视频目标跟踪关键技术进行了深入的研究,主要研究内容和相关成果具体如下:(1)针对复杂场景下目标跟踪区域存在背景像素干扰的问题,提出了一种基于前景色调直方图的目标跟踪方法。该方法将运动分割结果和色调直方图特征相结合构建目标模型,并在跟踪过程中对目标模型进行及时更新。在复杂场景下目标跟踪区域中包含背景像素干扰时,所提出的方法有效增强了目标跟踪的稳定性。(2)针对复杂场景下噪声干扰或误匹配导致单一SIFT特征跟踪失败的问题,提出了一种基于SIFT特征和色调直方图的联合跟踪方法。该方法将SIFT特征和色调直方图特征相结合构建目标模型,采用归一化处理方式使得二者在公平条件下进行融合,并在跟踪过程中对目标模型进行及时更新,该方法在复杂场景下获得了比单一SIFT特征跟踪更好的稳定性。(3)针对压缩感知理论和视频运动目标跟踪过程有效结合的问题,建立了一种基于压缩感知理论的粒子滤波跟踪模型,并讨论了压缩测量矩阵的选择、压缩测量过程的实现和压缩测量向量的解析三个核心问题。在该模型约束下,提出了一种基于粒子滤波的压缩跟踪方法。该方法基于压缩感知理论对Haar-like特征进行压缩采样,采用粒子滤波方法对候选目标进行预测。与已有基于压缩感知的跟踪方法相比,该方法不仅增强了复杂场景下目标跟踪的实时性,而且保持了跟踪的稳定性,进而实现了高效的视频目标跟踪。(4)针对基于压缩感知的目标跟踪中如何选择普适压缩测量矩阵的问题,提出了一种基于自适应测量矩阵的快速压缩跟踪方法。该方法测量矩阵的稀疏程度、列数和行数皆随着给定跟踪目标而自适应地变化,而且该测量矩阵能够高概率地保持原始信号空间两点间的距离。与最新的基于Haar-like特征的目标跟踪方法相比,该方法在复杂场景下取得了更加稳定和实时的跟踪效果,进而实现了更为高效的视频目标跟踪。另外,在实验过程中发现了以下三点现象:降低测量矩阵的稀疏程度将使得每个测量元素含有更多的原始信号信息;压缩测量过程的计算复杂度取决于测量矩阵稀疏程度和测量向量维数两个因素;跟踪成功率的高低与测量向量维数的高低没有必然的对应关系。