论文部分内容阅读
随着互联网快速发展,以互联网作为载体的信息传播速度越来越快、范围越来越广。不良违法分子,利用互联网传播快速的特点,大量的通过网络社交媒体发布煽动性言论、图片或视频。暴恐视频或图像非法传播已成为当前影响社会稳定的毒源之一。如何阻断不良信息通过互联网的传播,已经成为当前研究的热点。本文研究总结已有的不良信息阻断方法,提出对用户侧的网络视频中的特定图像内容进行检测。针对特定图像内容检测,主要研究图像中包含“持枪并保持射击姿态的人”,本文的研究工作如下:分析现有的物体检测方法并选择Faster R-CNN作为枪支检测模型,该模型在常规的基于卷积神经网络进行物体分类的基础上,还可以给出被识别物体对应的位置信息,为后续人与枪支的交叠区域检测提供依据。本文中共识别4种枪支类型,分别为:AK47、M16、92式、95式。收集原始数据后,通过旋转增量技术,将每一类的枪支数据集扩展到约3600张。通过对使用不同的特征提取网络的Faster R-CNN模型训练后,记录各个模型识别每一类别枪支的识别精度和记录各个模型的mAP指标进行对比,确认使用ResNet-50网络作为特征提取网络时的检测结果优于使用其它两种网络。针对现有的基于深度摄像机的人体动作角度特征提取方法的应用限制,提出一套完整的基于人体骨骼数据的人体动作角度特征提取方法。根据人体动作角度运动空间,将其分为左右对称的6个角度。针对这6个角度通过数据归一化和坐标变换预处理后,建立对应的数据集。本文选择SVR作为基线模型与回归神经网络的输出结果做比较。通过模型比对可以确认,回归神经网络的各项输出结果的指标均优于SVR模型。这种方法在体感交互和人体动作识别方面均有广泛的应用前景。针对现有人体动作识别方法应用到视频图像中存在的问题,本文提出使用回归神经网络输出的角度特征结合人体手臂的骨骼数据生成新的特征向量。最后,构建2个分类神经网络对新的特征向量进行训练,达到特定人体动作分类的目的。实验结果表明,右手臂的特定动作识别的精度指标和召回率指标分别为:86.3%和89.7%;左手臂的特定动作识别的精度指标和召回率指标分别为:85.1%和88.5%。但受数据集的丰富性和骨骼数据的准确性所限,对未训练过的图像进行测试时发现,其识别率会有所降低。