论文部分内容阅读
随着科技的不断进步,视频监控已经在银行、电力、交通、安监等领域得到了广泛应用,视频监控需求也在全球范围内急剧增长。但目前监控视频的主要用于人工实时监测和事后查找,同时视频监控中很多有价值信息也随着时间而被覆盖,这些情况造成了巨大的人力资源和数据资源的浪费。因此,研究计算机视觉非常必要。运动目标检测和识别是计算机视觉中的重要分支,Vibe算法是一种典型的运动目标检测算法,但是这种方法存在对“鬼影”消除速度缓慢以及对全局光线变化的抗干扰性差等缺点。在图像分类上,VGG16是一种经典的基于卷积神经网络的图像分类网络,在各种图像分类中有着优异的表现,但VGG16也存在参数量大、训练速度慢及容易过拟合等缺点。针对上述问题,本文首先对Vibe算法进行了改进,有效改进了Vibe算法,有效改善“鬼影”、光照突变适应性差等问题。其次,本文对VGG16网络进行调整,有效改善了网络模型的参数数量过大、分类速度较慢等问题。最后,本文通过本文结合两种方法对运动目标检测识别方法进行了实现。本文主要工作如下:(1)结合Vibe算法和三帧差分法提出了一种改进的运动目标检测算法。同时使用Pets2006、wallflower等多个数据集对提出算法进行检测验证。(2)在VGG16基础上,通过修改输入图片的大小、调整全连接层神经元数量以及引入全局平均池化层等方法提出四种基于卷积神经网络的图像分类模型,并用cifar-10数据集对几种模型的准确率和分类速度进行评测。同时还使用自建数据集对模型进行训练,为后续运动目标检测识别提供分类模型。(3)将提出的运动目标检测算法和基于卷积神经网络的图像分类模型结合,实现一套完整的运动目标检测识别程序,并用不同大小的图片序列测试程序的分类性能及有效性。本文针对运动目标检测与图像分类技术,本文提出一种结合改进Vibe算法和VGG16的运动目标检测识别方法,并进行了编程实现。该程序可以实现视频中运动目标的检测和识别,有效降低视频监测中的人工成本。