论文部分内容阅读
在当前的目标检测领域中,行人检测有着不可取代的地位,它既是该领域中的难点问题,也是广大研究者关注的热点问题。近年来,鉴于人工智能的迅速发展,使得行人检测技术在精度和速度上有了进一步的提升需求。深度学习作为当前很热门的机器学习算法,因此它在行人检测领域的应用是一个值得关注的研究方向。本文围绕基于机器学习的行人检测方法展开,从基础理论出发,详细地阐述了行人的特征表示与分类策略,系统地归纳了现今行人检测问题的关键困难点以及已有方法所留存的问题。研究表明传统的HOG+SVM和CNN深度学习方法存在提取到的行人特征复杂、计算量大,并且检测结果容易受到遮挡、复杂背景以及光照等因素的影响等弊端。因此,提出了一种改进的CNN模型,该模型主要有以下两个阶段完成。(1)首先通过分析已有的基于CNN的行人检测算法的性能,发现其都是直接对原始图像进行卷积操作的,这使得计算量非常之大,并且检测结果易受复杂背景的影响,对此本文提出先对待检图片进行预处理,过滤一些没有用的特征,再对其进行卷积操作。本文分别对待检图片做了梯度预处理和纹理预处理,分析在不同预处理操作下算法的检测性能,实验表明经过纹理预处理之后的检测性能优于经过梯度预处理后的检测性能。(2)利用选择性搜索算法对待检图片提取行人预选框,以应对滑动窗口法所带来的预选框数量庞大的问题;再对提取到的预选框进行放缩,使其统一成64*128大小的灰度图像,接着对缩放后的图像进行纹理预处理,过滤掉复杂背景,突出行人的纹理特征;最后将经过纹理预处理过的特征图输入到CNN模型中进行检测,实验结果表明,改进后的CNN模型在每张图片中错误的正例(False Positive Per Image,FPPI)占总的正例的比率为0.1时,漏检率为27.2%,相比经典的CNN的38.4%而言降低了 11.2%。