论文部分内容阅读
稀疏表示是一种高效的信号处理技术,符合人类视觉系统感知外界信息的原理,在计算机视觉的各个研究领域中具有良好的表现。其中,视频中的人体动作识别在智能监控、人机交互和多媒体内容分析等领域具有着广泛的应用前景。所以,基于稀疏表示算法的视频动作识别研究吸引了许多学者的关注。动作视频的特征提取方式种类繁多。理论上,融合多种特征应该能够提高动作识别的正确率,然而事实上由于不同模态下提取的特征在特征空间中的分布有所不同,单纯的将多种特征融合在一起不能达到理想结果。另一方面,在利用稀疏表示进行视频动作分类时,不同特征和字典元素对于分类的贡献是不同的,平等地对待这些元素无法充分利用它们所包含的信息。为了解决视频动作识别中的这些问题,本文分别提出了针对RGB-D特征融合和基于元素判别性感知的稀疏表示改进算法。1)本文针对RGB-D特征融合分别提出了最小重构误差分类方法和最大非零项个数分类方法。为每种特征学习一个独立的字典,然后得到测试样本在每种特征下的稀疏表示系数,最后通过计算融合重构误差和融合非零项个数实现动作识别。该方法能有效地融合RGB-D特征进行动作识别,同时能够分析出每种特征在融合过程中的贡献大小。2)本文通过增加特征和字典元素的判别性改进了传统的稀疏表示分类方法,提出了基于元素判别性感知的稀疏表示分类方法。首先利用特征判别性信息对数据进行预处理,然后对学习到的字典,计算出其所有元素的判别性信息。在分类过程中计算出测试样本特征的判别性信息,最后同时利用特征和字典元素的判别性信息来判定其所属的动作类别。该方法减小了异常数据对于分类结果的影响,并充分挖掘了特征和字典元素的判别性信息,实验证明该方法能有效提高动作识别的准确率。