论文部分内容阅读
近年来,视频监控和智能交通系统的发展越来越开放,为整个社会的进步提供了更加宽阔的空间。行人检测技术作为其最重要的内容之一,是指根据图像或视频帧获取的相关信息,利用计算机视觉相关算法定位并检测出目标。行人检测广泛应用于智能驾驶、智能交通系统、机器人与高级人机交互等领域中,而且与人们的生命息息相关。尤其在交通事故中,伤亡者大多是路上的行人,如何提高行人的检测性能,确保行人的安全,引起了越来越多相关专家人士的关注和研究。行人检测有很大的发展远景,但是目标行人的定位、检测等过程比较困难。人体本身的形态、姿态、外表和服装变化、场景的多样性等影响;天气变化、光照、像素等外部环境因素的影响,都对行人检测造成了一定程度的困扰。随着深度学习方法在行人检测方面取得了很多突破性成果,能在一定程度上提高行人检测的性能。因此,本文主要以深度学习为基础,进行行人检测的研究实验。本文主要从以下几方面进行研究:(1)深度学习行人检测的网络设计。首先,基于Faster R-CNN算法框架,为了选择性能较好的网络,使用两种不同类型的数据集对目标检测领域流行的两种卷积神经网络VGGNet、ResNet进行研究分析;其次,研究对比不同参数对网络的影响;最后,设计出行人检测网络结构,为后面的研究提供基础。(2)浅层特征融合引导的深层网络行人检测。针对当前行人检测算法在复杂场景中目标太小情况下漏检的问题,提出一种浅层特征融合和深度卷积网络特征相结合的方法。首先,为了提取行人的高质量特征,研究了深度卷积神经网络的隐藏层特征规律。从卷积神经网络的第一块(block)提取两种常见的行人传统特征——HOG特征和改进的LBP特征,并且与深层卷积网络特征相融合;其次,借助区域建议网络(Region Propose Network,RPN)的优点,设计选择适合行人数据集的锚点;最后,利用高效的行人特征,进行目标候选框分类和预测。结果发现,在Caltech行人数据集上,在复杂场景中可以有效检测出远景处较小目标行人及近景处遮挡行人。(3)植入BN层的VGGNet网络行人检测。针对当前行人检测近景处遮挡行人的漏检情况,提出对VGGNet网络结构进行改进的方法,鉴于BN层快速收敛,学习模型效率高的优点,在网络的每一个卷积层加入BN层,进行行人检测的分析和预测研究。结果发现,在Caltech行人数据集上,此方法一定程度上可以提高检测性能,有效检测出遮挡的行人。