论文部分内容阅读
运动跟踪识别,是计算机视觉的基础和关键技术以及数字图像处理的重要分支。它为用户提供查看和检索的运动信息,为目标特征提取、识别分类提供基础,其结果直接影响行为理解、语义描述以及推理决策等后继的高层次处理。目前这些技术已在军事科学、生物医学科学、信息科学和气象学等领域的科研和工程实践中发挥着极大的作用。本论文研究了运动跟踪识别中光流和遮挡的计算检测、运动目标的跟踪、动作识别的三个具体问题。这三个具体问题是计算机视觉领域中研究内容的重要组成部分,为智能化分析提供重要依据。然而,由于运动状态的复杂性以及人类对视觉系统感知运动的机理认识不足,运动跟踪识别仍然是一个富有挑战性难题。稀疏表示的特征是具有稳定的重构能力和充分的维度减少能力。它能够有效的表示图像/视频数据中本质的、有意义的关键内容,抑制噪声和遮挡的影响。基于稀疏表示的最小化,能有效的提高运算的效率和鲁棒性。目前,基于稀疏表示模型的方法引起了广泛的关注。本论文内容包括四个方面:基于稀疏模型实现光流和遮挡的计算检测;发展一个鲁棒稀疏模型;发展一个稀疏模型用于运动目标的跟踪;基于稀疏模型实现动作识别。(1)在遮挡区域中,有意义信息过少往往导致运动物体出现模糊属性。为此,本文组合了时空域与变换域中的稀疏特征表示遮挡,采用Stein-Weiss解析函数作为变分模型正则化函数和稀疏模型变换函数,从而建立一个统一的没有经由稀疏转换的稀疏模型和伴随有稀疏转换的稀疏模型的光流框架。对于伴随有稀疏转换的稀疏模型的字典学习,通过没有经由稀疏转换的稀疏模型直接生成一个全局的字典,从而将该全局的字典生成对应层叠块的小块字典。在Middlebury和Sintel评估数据库中,对比目前一些流行的检测光流与遮挡的算法,本文的算法具有优越的表现效果。(2)为了有效地从多个任务中选择共享的稀疏特征,本文提出了一个鲁棒的多任务学习模型。在损失函数方面,非平滑函数的调节设置抑制了每个任务噪音的影响。在正则化条件方面,非凸性质的正则化条件能够良好地逼近原始的0型正则化条件,且凸性质的正则化条件往往允许有一个全局的最优解。本文使用了凸性质和非凸性质的条件正则化加权矩阵,进行有效的平衡和杠杆;同时发展了一个有效的优化方法解决非平滑非凸的最小化问题。在合成的数据与评估数据集的实验中,对比目前一些流行的多任务特征学习算法,本文的算法具有优越的表现效果。(3)为了有效地在目标跟踪中应用多任务共享稀疏特征,本文提出了一个具有调节和识别能力的多任务稀疏特征模型。在损失函数方面,非平滑函数的设置调节了每个任务的噪音水平。在正则化条件方面,加权矩阵分离为两个特定的结构,探索相关任务的共享稀疏特征以及识别不相关的任务;同时发展了一个有效的优化方法解决非平滑非凸的最小化问题。在公开可用的视频序列数据库中,对比目前一些流行的目标跟踪算法,本文的算法具有优越的表现效果。(4)本文还应用了lasso稀疏模型,将动作识别作为基于最大平均相关高度滤波的最小化问题,建立了一个简单动作识别算法。评估数据集的实验表明了,本文提出的算法具有良好的表现。