基于SSD算法的交通场景行人检测研究

来源 :安徽师范大学 | 被引量 : 1次 | 上传用户:mingxue27
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测技术是智能辅助驾驶系统中的关键技术,一直以来也是计算机视觉领域的研究热点之一,能有效减少交通事故的发生,提高驾驶的安全性,对保障人民群众的生命财产安全具有重大意义。但是由于交通场景中的行人目标存在姿态多变、行人所处的背景环境复杂以及行人目标较小等情况,使得目前的行人检测算法在实际应用中存在检测精度不高、检测速度较慢的问题。因此针对道路交通场景下的行人检测任务,考虑精确度和实时性检测的需要,论文基于SSD算法对交通场景行人目标的检测进行了研究。本文主要工作如下:首先介绍了目前主流的YOLO目标检测算法的工作原理及实现流程,通过对交通场景中行人的检测,分析实验数据可知该算法检测速度较快,但对尺度变化较大的物体泛化能力较差,当图像中有过于密集的目标时,容易发生误检、漏检的情况。其次,为了解决上述问题,本文主要研究了与YOLO算法同样满足实时性要求的SSD算法,该算法达到了和两阶段方法相当的精度,同时又保持了较快的运行速度。但是传统的SSD算法对于交通场景中小尺度行人目标的检测能力仍然不够理想,基于此,对SSD算法在网络结构上做出了以下改进:(1)卷积层结合稀疏连接。通过将主干网络的卷积层结合Inception模块中的稀疏连接,优化卷积结构,增加特征图中小目标的语义信息,从而增强网络的特征提取能力。(2)检测模块采用残差结构。当SSD网络提取出多尺度特征图之后,利用残差结构组成的检测模块代替传统的3×3大小的卷积核,来进一步提取特征图的深层特征,提高对小的行人目标的检测精度。(3)引入Focal Loss函数。引入Focal Loss函数设计新的损失函数,通过调制因子调整样本的权重,解决训练过程中正负样本不平衡的问题,使得网络更加关注于包含更多有用信息的困难负样本,从而加快网络的收敛,训练过程更加稳定。最后,分别将YOLOv2、YOLOv3、SSD以及改进的SSD共四种目标检测算法在公开的Caltech行人数据集上进行训练和测试,评估几种算法针对道路交通场景中行人检测的性能。实验结果表明,基于改进的SSD算法对于小尺度的行人目标在检测精度和速度上都有所提高,从而在一定程度上提高了对交通场景下行人检测的精度并保证了检测的实时性。因此,本文基于SSD算法对道路交通场景行人检测的研究具有重要的理论意义和广泛的应用价值。
其他文献
由于预脉冲电流幅值、主脉冲电流幅值等参数变化对激光的影响并未有规律性结论,本文将主要对内径为4.0mm毛细管的46.9nm毛细管放电软X射线激光特性在改变实验条件下的变化规
图像描述,即产生给定图像的自然语义描述,是使得机器能够理解图像内容的关键任务。遥感图像描述是此领域的一部分。大部分主流的图像描述模型通常由编码器和解码器组成。在编
随着红外技术的迅速发展,导引头的红外探测系统性能得到了很大的提升,但目前的半实物仿真系统无法提供足够的原始图像数据,影响了红外制导技术的发展。为了充分发挥半实物仿
生物体依靠蛋白质与蛋白质或蛋白质与其他物质之间的相互作用来完成各种生命活动,有关蛋白质相互作用的研究对理解生物体中各项活动的机制有着重要的意义,同时也存在着广泛的
随着大数据时代的到来,当今时代每天都有大量的数据产生,如何使这些信息得到有效的利用是当前的主要问题,上世纪九十年代推荐系统应运而生,其通过对过往信息的整理与分析,可
近几年,随着信息技术的发展,网络中产生了大量的数据。推荐系统可以通过分析与用户相关的数据,自动向用户提供所需的信息,缓解了海量数据带来的信息过载问题。然而,由于数据
在智能城市,大型基础设施的运行监控,可穿戴式协助设备和物联网等几种新兴应用场景下,用RDF来描述各种传感器传入的数据信息,可以清晰的表示各主体之间的关系,与此同时,传入
小儿脑性瘫痪是一种主要以新生儿为病患对象的脑功能障碍疾病,患者普遍存在严重的肢体运动障碍,部分患者伴有听视觉障碍、智力低下、语言功能缺陷等问题,疾病的产生原因主要
图像和视频的识别一直是计算机视觉领域的关键问题。神经网络作为最可靠的计算机视觉方法之一,已经在这个领域发挥着越来越重要的作用。在图像与视频的识别过程中,其光照条件
稀土金属-有机骨架分子材料(Rare Earth Metal-Organic Frameworks Molecular Materials)因其新颖独特的结构和优良多面的性能成为近几年来科学家们研究的重点。稀土金属本身