论文部分内容阅读
行人检测一直是机器视觉领域的研究热点和难点,其在智能监控、智能交通和智能机器人等人工智能领域应用越来越广泛,比如在交通安全领域,利用行人检测技术可以预判前方及附近是否有行人,若发现则立即采取紧急制动,这样能够有效避免车辆碰撞行人,减少人员伤亡。行人检测不同于普通目标检测,行人属于非刚性目标,在现实生活中,行人穿着各式各样、人体姿态千变万化、所处背景复杂多变、光照不足以及行人之间相互遮挡等情形给这项工作带来巨大的挑战。前人提出了许多有效的行人检测算法,其中最有代表性的是梯度直方图(Histogram of Oriented Gradient,HOG)特征,但其在更为复杂的背景环境下检测效果仍然不是很理想。近年来,深度学习重新进入人们的视角,其中深度卷积神经网络在模式识别方面更是取得了重大的突破,说明了其在特征提取方面的优越性。本文在充分研究行人检测技术以及深度学习尤其是深度卷积神经网络模型的基础上取得如下成果:(1)设计了基于区域卷积神经网络的行人检测系统。针对传统人工设计的特征提取复杂度高且难以有效表达复杂场景中的行人特征的问题,本文采用深度卷积神经网络模型来进行行人检测,该模型通过组合低层特征形成更加抽象的高层表示属性类别或特征,进而从样本中提取鲁棒性更强、更能刻画图像的特征向量。由于网络模型层次较深,需要训练参数较多,而人工标注行人的数据样本较少,为了防止训练过程中的过拟合现象发生,本文采用微调的方法训练网络。最后,通过多组实验的验证,与基于HOG特征的方法想比,该算法能够明显提升行人检测的准确率。(2)针对行人检测系统中采用选择性搜索算法(Selective Search,SEL)获取预选区域效率低下的问题,本文采用Edge Boxes算法优化了行人检测系统。预选窗口的获取对于行人检测系统至关重要,利用选择性搜索算法提取一张图像的预选区域需要花费2秒左右,这严重影响了整个行人检测系统的检测效率。当本文采用Edge Boxes算法提取预选区域时,虽然检测准确率没有明显的提升,但只需要耗费0.3秒的时间来提取一张图片的窗口,大大改善了系统的检测效率。(3)设计了基于快速区域卷积神经网络的行人检测框架。针对采用深度卷积神经网络进行特征提取难以保证实时性的问题,本文在网络模型中引入了感兴趣区域汇聚层(RoI Pooling Layer),通过该层模型只需要对原图像提取一次卷积特征,并将预选区域映射到特征图(Feature Map)中后,得到固定维度的特征向量。实验表明,使用该方法在保证一定检测准确率的情况能够极大的提升检测速度,改善了算法的实时性和适用性。