论文部分内容阅读
人体行为识别是计算机视觉领域内一个非常活跃的研究方向,具有十分重要的理论研究价值和广泛的应用场景,比如智能视频监控、视频检索、智能监护和人机交互等。近年来,人们已提出了大量方法,从不同角度解释和处理人体行为识别问题。尽管这些方法已取得了一定成果,然而由于人体行为本身以及所处环境的复杂性,行为识别技术中还存在很多问题值得深入研究。人体行为识别通常被看作是一个模式分类问题,主要包括行为特征提取与表达和行为分类两大部分。论文以包含人体行为的视频序列为研究对象,分析了现有行为识别方法的特点和不足,并针对这些不足,对行为特征提取与表达及相关行为识别方法进行了深入研究,提出了一些新的解决思路和方法。论文首先提出了人体行为低秩特征,随后提出了累加边缘分布直方图的特征表达方法;然后针对如何增强行为低秩特征抗背景干扰的能力及捕获时间信息的能力提出了两种改进方法,并对相应的行为识别方法进行了深入研究,提出了新的判别部件学习模型和字典学习模型。最后在三个具有代表性的行为数据库上验证了论文提出方法的有效性。论文的主要贡献和创新点归纳如下:①提出了运用行为低秩特征提取视频序列中行为信息的方法,并确定了可行规则化参数及其计算公式。传统行为特征提取通常需要人体目标的检测、分割、跟踪或兴趣点检测等预处理步骤,而这些处理步骤本身还存在不少困难未被解决,其产生的处理误差也会传递到后续的行为分类当中。相比传统行为特征,行为低秩特征的提取方式更加简洁,有效地避免了上述预处理步骤。然而在行为低秩特征的提取过程中,传统规则化参数难以有效提取出视频序列中的行为信息;为此进行了大量实验研究,并最终确定了可行的规则化参数及其计算公式。实验表明本文确定的规则化参数的特征提取效果远好于传统规则化参数。②提出了累加边缘分布直方图的行为低秩特征表达方法。由于行为低秩特征自身的特性,传统的特征表达方法难以有效描述出其中的行为信息。研究发现行为低秩特征中的边缘信息可以很好地克服行为执行者服装灰度信息带来的影响;同时视频序列中的人体运动也会产生相应的边缘信息。因此首先提取行为低秩特征的边缘信息,然后对边缘信息的分布进行统计,并最终形成累加边缘分布直方图的行为低秩特征表达。在三个基准数据库上的实验表明,累加边缘分布直方图比其他传统特征表达方法更适合用于表达行为低秩特征。③提出了一种基于行为低秩特征中判别部件学习的行为识别方法。判别部件学习与行为低秩特征具有很强的互补性。从行为低秩特征中学习判别部件,能有效增强行为低秩特征的抗背景干扰能力,同时又能极大程度地克服传统部件学习中的“背景记忆”问题。然而传统的部件学习方法通常是对所有行为类学习相同数量的判别部件,忽略了各行为类之间识别难易程度的差异。为此提出了一种灵活数量判别部件学习模型,该模型可以针对不同行为类学习灵活数量的判别部件。在该模型中定义了新的相似性约束,更加有利于判别部件检测器的产生;同时运用组稀疏规则化方法自动保留每个行为类别中判别力强的部件检测器。实验结果表明了提出的判别部件学习模型的有效性,以及相应的行为识别方法具有更优的识别性能。④提出了一种基于时序行为低秩特征和字典学习的行为识别方法。为捕获视频序列中的时间信息,研究了时序行为低秩特征。首先将整个视频序列按一定重叠率划分为多个行为子序列,然后分别提取行为低秩特征,最终按时间顺序将其串联形成时序行为低秩特征。研究发现时序行为低秩特征更适合通过字典学习来进行分类。然而传统的字典学习模型未考虑各样本编码系数的相似性约束问题,同时难以很好处理非线性可分数据。为此,提出了一种相似性约束的判别核字典学习模型。该字典学习模型中加入了相似性约束以约束各行为样本的编码系数,进而训练出性能更好的分类器;同时引入了核映射方法,以增强模型处理非线性可分数据的能力。实验结果表明了提出的字典学习模型及相应的行为识别方法的有效性。