论文部分内容阅读
人体动作中包含了丰富的肢体语言和情感色彩。利用人体动作进行人机交互,可使用户获得更加自然、高效的交互体验。然而,人体动作具有高度复杂性和风格多样性。随着人们对动作捕捉的精度要求不断提高,使用具有多个节点的穿戴式传感器已成为一种主流趋势。传感器节点的不断增多预示着动作捕捉数据的维度不断上升。如何从高维的动作捕捉数据中提取出低维有效的动作特征已成为人体动作识别领域中的一大挑战。因此,本文基于特征层面对人体动作的识别算法开展研究。针对人体动作的风格多样性问题,本文提出了人体动作的量化方法,利用较少数量的动作单词对原始的人体运动序列进行表示。为去除动作捕捉数据中的冗余信息,提出了利用6个重要的角度特征对人体运动的每一帧姿态进行表示,形成角度特征序列。利用关键姿态提取和层次聚类方法,从角度特征序列中提取出动作单词。通过将原始动作序列中的每一帧数据替换为与其距离最近的动作单词,有效减少了人体动作的差异性。人体动作量化方法的提出也为后续开展的特征降维和主题建模奠定了重要基础。针对常见的降维方法对人体动作特征的信息抽取能力较弱的问题,本文提出了利用广义判别分析对动作特征降维,通过引入核函数,将动作特征映射到高维空间,借助线性降维方法降低动作特征的维度。为进一步提升动作识别的准确率并降低计算复杂度,本文基于主题模型从动作序列中发掘出来的主题信息,提出了一种新的动作描述子动作主题直方图。考虑到主题模型忽略了动作的语法信息,本文结合主题模型和隐马尔可夫模型的动作识别方法,提出主题-状态直方图的动作描述子。在分类器的设计中,根据研究动作的特点和应用场景,构造了层次支持向量机分类器。实验结果表明,相较于线性降维方法,广义判别分析具有更好的信息抽取能力。与常用的描述子最大信息量关节序列相比,动作主题直方图具有较低的计算复杂度,并在识别率上高出4%左右。结合语义信息和语法信息的动作描述子主题-状态直方图在动作主题直方图的基础上提高了1%左右的识别率且计算复杂度不变。