论文部分内容阅读
运动目标检测是视频分析领域的基础,提取目标的准确率直接影响行为识别、车辆识别和行人重识别等复杂任务的精度.因此,研究高准确率的运动目标检测算法具有十分重要的意义.本文主要研究深度神经网络在运动目标检测中的应用,通过构建卷积神经网络模型,实现背景建模和运动目标分割,并对神经网络模型的可行性与可靠性进行了分析和实验验证,主要工作如下:首先,针对传统背景建模方法无法适应大幅度背景变化的问题,引入卷积神经网络,提出了视频帧图像分类网络.通过将背景建模问题变成图像分类问题,网络可以学习整个背景图像的像素值分布,比传统算法更加充分地利用了图像信息.其后,针对背景帧和运动目标帧比例不均衡的问题,在损失函数中引入两个超参数,使网络同时关注背景帧和运动目标帧的分类准确率.其次,鉴于反卷积网络在神经网络可视化领域的成功应用,提出了基于反卷积的运动目标分割网络.先通过多个卷积层逐层提取图像特征,再以同样数量的反卷积层将特征图还原到原输入空间,并加入真实分割图像,逐层学习运动目标的真实分割模式.另外,提出类平方损失函数来衡量真实分割图像和预测分割图像之间的误差,对背景帧的分割图像和运动目标帧的分割图像分开并单独处理.最后,针对视频帧图像分类网络和运动目标分割网络在卷积层中提取到的特征不一致的问题,引入多任务学习框架,提出了多任务卷积神经网络,同时进行背景建模任务和运动目标分割任务.该网络共享了两个神经网络卷积层的参数,并分别保留了其他层参数,将两个网络最终融合成一个单输入多输出的网络.此外,对损失函数进行了改进,将多目标优化问题变成单目标优化问题,提高了网络训练的效率.基于视频帧图像分类网络和运动目标分割网络的多任务卷积神经网络模型,将背景建模问题与运动目标分割问题并行处理,在真实数据集上的实验表明,经过合适训练的网络模型对于运动目标的检测是可行和可靠的,相较于其他传统主流检测算法,网络模型对背景像素点的误检更少,提取到的运动目标图像准确率更高.