论文部分内容阅读
近年来,为不断推进平安城市建设,安防监控设备在全国各地得到广泛应用。如何使用计算机视觉技术对视频监控中的暴力行为实现有效的智能化分析,对维护社会稳定,保障人们生命和财产安全至关重要。随着深度学习的快速发展,该文在深度卷积神经网络基础上,对视频暴力行为检测进行研究,主要研究内容包括以下几点:首先,针对人工设计特征的方法检测率较低,计算复杂度较高的问题,提出三维卷积神经网络视频暴力行为检测算法。通过对输入的原始视频帧序列进行三维卷积和三维池化操作,获取视频深层时空特征信息,实现端到端的暴力行为检测;此外,为提高网络泛化能力,加速网络训练,在每个卷积操作之后均进行批量归一化;为进一步避免因数据集样本较少而产生的网络过拟合现象,在两个全连接层之后添加Dropout层。实验表明,该算法优于传统方法,具有一定的有效性。其次,为充分利用视频时空特征信息,提高检测准确率,在双流卷积神经网络基础上,提出双流三维卷积特征融合视频暴力行为检测算法。采用三维卷积神经网络(Convolutional 3D,C3D),对连续的视频帧序列进行特征提取,不仅可以获取视频空间信息还可有效提取视频时空融合信息;采用16层的VGG网络(Visual Geometry Group Network,VGGNet-16),对堆叠的光流图像进行特征提取,获取运动信息;最后将两个模型的预测结果在分类层进行均值融合得到最终分类结果。实验表明,该算法可有效提升视频暴力行为检测准确率。最后,针对网络模型参数量大,计算复杂度高的问题,在密集连接卷积网络(Densely Connected Convolutional Network,DenseNet)基础上,提出三维卷积密集连接网络视频暴力行为检测算法。通过对视频帧序列进行三维卷积和三维池化操作,获取视频时空特征;网络层采用密集连接方式,提高特征重用率,强化特征传播,模型参数量减少,可有效避免随网络层加深带来的梯度消失问题;为降低网络层输出特征维度,在三维密集连接模块之间采用过渡层;最后经过Softmax层得到最终的分类结果。实验表明,该算法在视频暴力行为检测任务中具有一定的有效性。