论文部分内容阅读
视觉目标跟踪(Visual Object Tracking)是计算机视觉和模式识别领域的热点问题,它在视频监控、智能交通、人机交互、行为分析、医学图像处理等领域有着广泛的应用。视觉目标跟踪算法主要分为目标初始化、表观建模、运动估计和目标定位四部分,其中,表观建模是目标跟踪成功的先决条件。由于受复杂背景、光照变化、非刚体形变、遮挡等因素的影响,设计一种鲁棒的表观模型一直是视觉目标跟踪的难点。本文从表观建模中的目标表示和统计模型出发,研究了如何构造有效的表观模型以实现鲁棒的目标跟踪。本文的主要贡献有:提出了一种基于锚点标签传播的判别式跟踪方法。根据样本与锚点的映射关系及锚点的标签值,每个样本的软标签值可以表示为锚点标签的加权平均。为此,本文设计了一种局部锚点近似的策略来求解每个样本与锚点之间的相似性(亲近程度),并将拉普拉斯正则项融合到标签预测目标函数中以保留样本间的局部几何结构关系。在贝叶斯推理框架下,软标签预测值最高的候选目标将被视为最终的跟踪结果。在无需指定样本分布的情况下,该方法可以有效地将少量样本的初始标签传播给其它大量的无标签数据,非常符合判别式跟踪的需求。在Benchmark测试集上的实验表明该方法要优于其它最新算法。提出了一种基于主动样本选择的判别式跟踪方法,目的是为训练样本选择与分类器学习建立统一的优化目标。在拉普拉斯正则化最小二乘半监督学习的框架下,该方法在样本采样和标签分配之间引入主动样本选择策略来自动选择最有信息量的样本用于分类器学习。该方法充分地利用了无标签样本的信息并保留样本空间的局部几何结构,能减轻跟踪漂移问题。在Benchmark测试集上的实验表明,通过引入主动样本选择策略可以有效地处理剧烈的目标表观变化。提出了一种流形自适应核稀疏表示方法并用于目标跟踪。流形自适应核函数将黎曼流形嵌入到高维的可再生核希尔伯特空间(reproducing kernel Hilbert spaces,RKHS)。在RKHS中,每个数据点可表示为字典基元的稀疏线性组合。图拉普拉斯(Graph Laplacian)做为流形的平滑算子被整合到流形自适应核中以充分挖掘数据空间的几何及判别结构。利用目标的流形自适应核稀疏表示,在粒子滤波框架下,本文设计了一种产生式跟踪算法。用簇比重(Bin-ratio)直方图距离计算目标模板与候选目标之间的距离来作为粒子滤波的观测模型,以确定最终的跟踪区域。在Benchmark测试集上的实验表明,该方法要优于基于稀疏表示的其它跟踪方法。提出了一种基于在线多示例度量学习的结构化稀疏表观模型。获取目标区域内局部图像块的稀疏编码后,该方法执行多尺度的最大汇聚操作以得到鲁棒的结构化的目标表示。利用多示例度量学习为得到的目标表示学习合适的度量矩阵使得同一物体的不同表观彼此相似,同时能使物体很好的从背景分离出来。在Benchmark测试集及其它常用测试序列上的实验表明,该方法要优于其它最新的跟踪算法。