论文部分内容阅读
目标检测是计算机视觉领域中一个富有挑战性的课题,其主要目的是从静态图片或视频中检测并定位特定的目标。它综合运用了图像处理、模式识别、人工智能和自动控制等技术,在道路交通事故预防、工厂可疑危险品警告、军事禁区监控、高级人机交互等方面有着广泛的应用。由于目标所处环境复杂多变,目前还没有一种比较通用成熟的检测方法,在实际应用中目标检测算法研究的机遇与挑战并存。本论文首先分析了国内外目标检测算法的研究现状,着重介绍了当前应用较为广泛的方法,使用目标特征训练分类器进行目标分类检测。针对使用现有特征训练的分类器进行目标分类检测时存在误检率较高的缺点,本文在深度学习的基础上提出了一种基于卷积神经网络的行人目标检测算法。为了解决直接使用卷积神经网络进行滑动窗口检测效率较低的问题,本文将算法分为两大步骤:(1)疑似存在行人窗口确认;(2)行人检测。在疑似存在行人窗口确认中,本文使用融合特征作为行人的描述特征训练分类器,采用了邻近尺度特征值相似的思想构建分类器金字塔,在待检图像上利用不同尺度的滑动窗口进行滑动遍历确定疑是存在行人窗口;在行人检测中,使用大量正负样本训练了一个卷积神经网络,为了更好的适应行人检测,将该卷积神经网络的拓扑结构进行改进。将疑似存在行人的窗口输入改进后的卷积神经网络进行行人检测,在保持原有的检测率的基础下降低了误检率。为了验证本文所提出算法的准确性,在INRIA行人数据库进行行人检测实验。分别以每个窗口和每幅图像为检测单位,统计本文算法的检测率和误检率,在平均每幅图像存在一个误检窗口的标准下,达到了93%的检测率。检测率比使用ACF特征训练的检测器高三个百分点,检测速度比单独使用卷积神经网络检测提升四倍以上。实验结果证明了本文算法的有效性。