论文部分内容阅读
行人检测是计算机视觉中重要的研究课题,在车辆辅助驾驶、机器人导航、智能监控中具有重要作用。近年来,随着人们对视觉的理解,视觉注意在目标检测中的应用取得了重大突破。因此,将视觉注意机制应用到行人检测中具有重要的价值和意义。本文主要完成以下工作:1)初级视觉特征和语义特征的计算。首先根据行人的外在特征,对基于图论的视觉注意模型进行改进,加强行人在场景中的显著性。其次,采用区域肤色模型计算肤色语义特征的显著性。最后,采用Haar特征与支持向量机相结合的方法计算行人头肩部语义特征的显著性。2)显著图融合。本文使用拉普拉斯金字塔对显著图进行融合,进而建立静态视觉注意模型。首先,对初级视觉显著图、肤色显著图和头肩部显著图构建高斯金字塔。其次,使用基于区域的融合规则对相同尺度下的显著图进行融合得到梯度金字塔。最后,经图像重构技术得到融合后的总显著图。3)视觉注意焦点的选择和转移。本文使用可形变部位模型进行焦点的选择和判断。首先,计算显著图的最大像素值,使用区域生长法向最大像素值的八邻域方向生长得到视觉注意焦点,之后计算视点的梯度直方图特征并使用隐变量支持向量机判断,完成焦点的转移。实验证明本文建立的静态视觉注意模型的性能好于其它三种模型,在标准行人数据库INRIA上采用拉普拉斯融合策略使得行人检测准确率达到92.78%。4)研究视觉注意机制和深度学习相结合的行人检测方法。首先,通过具有短连接的网络建立自顶向下的视觉注意模型并生成视觉显著图。其次,将视觉显著图和输入图像相乘,产生倍增视觉显著图。最后,将倍增视觉显著图送到检测网络中检测行人。实验证明,本文提出的方法检测性能较好。在Penn-Fudan数据集上的检测准确率为91%,在INRIA数据集上的缺失率为15%,在Daimler数据集上的缺失率为28%。