论文部分内容阅读
行人检测在车辆辅助驾驶、人体行为分析和智能机器人等领域有着广泛的应用价值,并且,近年来行人检测也逐渐被用于航拍图像、受害者营救等新兴领域,使得行人检测受到越来越多的关注。行人兼具刚性和柔性物体的特性,即在自然环境下的行人检测容易受到复杂背景、遮挡和分辨率低等非理想因素影响,同时行人自身也具有姿态多样性、身材和衣着多样性等影响检测的不稳定因素。针对这些因素影响导致检测效果不佳的问题,本文引入多尺度和空间金字塔池化策略并结合物体的显著性检测,探讨具有较强鲁棒性、检测效果较好,且检测速度快的行人检测方法。具体研究内容如下:首先,行人分类作为行人检测中的关键环节,其分类正确率对于后期的检测具有至关重要的影响。因此,本文在典型主成分分析网络(Principal Component Analysis Network,PCANet)的基础上,提出一种多尺度空间金字塔PCANet学习网络进行深度特征提取,并利用支持向量机完成行人的分类。该学习网络在PCANet的池化层引入空间金字塔池化策略,运用最大值池化方法对原始冗余特征进行筛选,逐层构建图像的特征描述子,在整合并优化原始池化特征的同时,捕获图像的结构化信息;然后将描述图像不同尺度并经空间金字塔池化的特征向量级联以获得图像的多尺度特征表示,使得学习网络既能提取到输入数据的高层语义信息又能获得底层细节信息,减少由于连续的逐层提取特征所造成的信息损失,这种多尺度和空间金字塔池化策略的引入使得在非理想条件下也能达到理想的行人分类正确率。其次,由于行人检测易同时受到多种非理想因素影响,并且传统的利用滑动窗生成候选区域的搜索策略会产生大量与行人无关的候选区域,难以满足检测实时性的要求。因此,本文在上述研究基础上,引入物体的显著性检测,提出一种结合二值化范数梯度(Binarized Normed Gradients,BING)和多尺度空间金字塔PCANet的行人检测算法。作为一种简单、高效的显著性检测策略,BING通过提取图像中行人的BING特征训练一组级联的支持向量机分类器搜索行人候选区域,快速过滤掉大多数与行人无关的区域;然后利用多尺度空间金字塔PCANet提取候选区域的特征以判断该候选区域是否包含行人,从而实现图像中行人的精确检测。实验数据表明,所提出的多尺度空间金字塔PCANet能够较好的实现行人的分类,不仅获得较高的分类准确率,而且对包含多种非理想因素影响的行人样本也具有较强鲁棒性。另外,将BING和多尺度空间金字塔PCANet相结合的行人检测算法不仅能保持较高的检测率,而且具有较快的检测速度,有效的兼顾了行人检测中的检测精度和检测速度。