论文部分内容阅读
近年来,人工智能技术逐步渗透到生活的各个方面,人们的生活因人工智能而发生着日新月异的变化。基于深度学习的实时行人检测技术作为人工智能的基础应用,为安防、自动驾驶、智能机器人等领域的发展提供了技术支撑,具有广阔的应用前景。本文以SSD目标检测算法为基础,对其进行优化,实现了对实时行人检测技术的改进。主要工作包含以下内容:首先,本文对行人检测算法的应用场景进行了分析和总结,对行人检测算法的研究现状进行了阐述,总结了行人检测算法中的重点与难点问题。其次,本文简要概述了基于机器学习的传统行人检测算法,对常用的机器学习相关算法的原理进行了分析。接着,重点介绍了基于深度学习的行人检测算法,对深度学习检测算法中的两步检测网络与单步检测网络结构进行分析。最后,详细阐明了单步检测算法中的SSD网络,并使用行人检测数据集设计实验,作为优化算法对比的基准。论文设计并优化SSD的基础网络结构,使用优化之后的Residual模块构建基础网络代替SSD中的VGG-16网络结构,不仅降低了网络的计算量,而且增加了网络的深度,提高了特征提取的能力。使用创新的特征融合方法对不同尺度的特征图进行融合,不仅构建了更合适的特征图,而且降低了用于提取预选框的特征层数量,加快了网络的实时检测速度,使得融合后的网络检测速度达到63fps。对所提出的方法,论文最后给出了实验验证。最后,论文优化SSD算法中的正负样本均衡化的问题,通过增加负样本数据来获得更多的困难负样本,提高网络对困难样本的区分能力。对损失函数进行优化,使得网络对正负样本的选择更加均衡,对不同的正负样本使用不同的权重计算损失值。对筛选网络输出预测框的非极大值抑制算法进行优化,提出新的评分函数对预测框进行重评分,提高对重叠目标的检出率。对于算法的优化,论文最后给出了实验验证。