论文部分内容阅读
动作识别系统在现实中具有重要的应用价值,但是现有的动作识别方法依然存在各种各样的缺陷,研究稳定可靠的动作识别方法,对于机器学习的理论发展与应用推广具有重要的意义。卷积神经网络是一种深度学习模型,它受到脊椎动物视觉神经系统的启发,能够直接从灰度图像学习出抽象的高级特征,具有强大的图像分类能力,但它不能直接应用于视频中的动作识别。为了将卷积神经网络的特征提取能力推广到动作识别,本文对卷积神经网络进行了扩展,本文的贡献主要有以下几个方面:基于时空卷积特征提取,开发了一个时空卷积神经网络框架。该模型以多个连续视频帧为输入,交替进行卷积和子采样操作,逐步提取出多种复杂抽象的高级特征,具有出色的特征学习能力与分类能力。为了进一步提高时空卷积神经网络的性能,在组合卷积层的输入特征图时,提出了一种稀疏自组合策略。通过对输入特征图增加稀疏性限制,使卷积层能够自动学习出最佳的特征图组合作为输入,与传统的手工设置方式相比,省略了手工设置的繁复步骤,实验表明,采用稀疏自组合策略的时空卷积神经网络具有更好的特征学习能力与分类能力。提出了一种基于MapReduce的矩阵并行相乘算法,基于该矩阵并行算法,在Hadoop平台对稀疏自组合时空卷积神经网络采用MapReduce编程模型并行化,并与串行实验结果进行了对比,验证了稀疏自组合时空卷积神经网络并行化的可行性、稳定性、正确性,并获得了一定的加速比。为了利用多核CPU的计算能力,将MapReduce的Map过程和Reduce过程采用多线程实现,将该算法用于稀疏自组合时空卷积神经网络的训练测试,性能进一步得到提高。分别在WEIZMAN和KTH两个公开数据集上进行了一系列实验,展示了时空卷积神经网络在各种场景下的表现性能。实验结果表明,与其他基准方法相比,本文提出的方法在两个数据集上表现出了非常有竞争力的结果。