论文部分内容阅读
行人检测和识别是智能视频分析领域一项重要的研究课题。在智能安防监控、人机交互、虚拟现实等有着广泛的应用。现实条件下由于摄像机安装的位置和角度受到限制,经常存在拍摄的图像中人体区域不完整、人体间产生相互遮挡的情况,所以人的头肩部位则成了行人检测难题的突破口。本文利用了头肩轮廓呈现比较固定的特点,对监控视频中的人头检测进行了新的探索和研究。本文着重研究了复杂场景视频中行人的运动检测算法,以及构建基于头肩轮廓特征的人头分类器并对目标进行检测识别。论文的主要内容和创新点如下:首先,对采集到的原始图像进行了预处理操作,采用了快速中值滤波去除噪声和灰度值拉伸以增加对比度,使图像能够在后续的处理中保证好的质量。其次,为了缩短扫描时间,先进行运动目标的检测,将包含行人的前景分割出来。建立了codebook模型进行运动检测,同时考虑到判别准则和像素的亮度直接相关,改进了经典的模型将RGB空间转换到YUV空间,使检测效果得到了提升。然后,设计了两个级联式分类器,分别采用基于类Haar特征和HOG特征进行先粗略后精细两级过滤的检测机制。特别地,由于头肩对称性的特点,提出了Joint HOG(组合Block的HOG)的特征提取算法,并选取多尺寸Block以增加基础特征,克服了传统HOG特征单一、计算耗时的缺点。其中HOG分类器的设计结合SVM和AdaBoost算法对样本进行训练,用线性SVM作为弱学习算法构造Joint HOG的弱分类器,再将这些分类器通过Cascade AdaBoost算法挑选出分类能力较强的若干SVM构成最终的级联式强分类器。一方面,SVM对于高维的HOG特征向量具有很好的泛化区分能力,另一方面通过AdaBoost又使得分类器的分类能力得到了提升。最后,通过对输入帧图像进行逐趟缩放的密集扫描,先后用Haar分类器和HOG分类器对滑动窗口计算特征值,根据设定的分类阈值,并采用规定数量和相近邻域原则对框出头肩目标区域进行融合,得到最终的目标框。