论文部分内容阅读
行人检测是计算机视觉领域的热门问题之一,近年来得到越来越多的关注。其相关技术是目前计算机视觉和模式识别研究中的难点和前沿问题,具有重大的学术意义和广阔的市场应用前景。但由于行人受光照、复杂背景、关节位置以及遮挡等因素的影响而呈现出各种各样的外观,因此实时鲁棒地在真实场景中检测出行人,挑战极大。目前还没有一个通用的,健壮的,精确的,高性能的和实时的行人检测算法。针对行人检测的精确性以及高性能的检测算法,本文开展了如下四个方面的研究工作:
1、研究各种图像特征算子,提出基于双线性插值的Shape Context特征,在一定程度上平滑原算法对于边缘噪声,以及突变情况的影响,提高描述子表述能力。并应用于行人检测算法中,分析Shape Context算子在行人检测中的实用性。
2、本文基于HOG特征算子,结合HIK SVM快速训练和快速分类的思想,针对目前行人检测算法时效性问题,设计行人检测算法。利用直方图相交核对于目前最为流行的直方图特征有着良好的分类效果的优点,结合HIK快速计算方法进行滑动窗口检测;使用非极大抑制的窗口融合算法,实现行人的准确定位,在保证行人检测精度的同时,提高检测的速度。
3、提出基于HIK SVM的多特征融合行人检测算法。针对HOG只利用图像梯度信息的缺点,本文采用基于LBP纹理信息特征与梯度信息相结合的多特征融合行人检测方法,以便结合两者各自的优点,更好的表达行人特征;并且采用两种特征的积分图快速计算方式,提高整个检测算法的效率。实验结果表明,采用多特征融合的方法可以提高行人的检测率。
4、提出基于CUDA架构,行人检测的多线程处理方法,进一步提高行人检测方法的效率,充分利用GPU在并行数据运算上具有强大计算能力的特点。在整个滑动窗口检测过程中,对特征提取以及分类器检测部分设计相应多线程处理核函数,充分进行并行运算,在更大程度上提高检测速度。
本文基于以上几部分研究工作,设计了完善的行人检测算法。通过实验分析,整个算法在保证行人检测准确度的同时,提高了行人检测的速度;并结合CUDA架构实现整个算法的多线程运算,取得了很好的时效性。