论文部分内容阅读
随着时代的进步,硬件计算能力的不断提升以及大规模数据的出现,深度学习在目标检测上取得了突破性的发展,它将特征提取和分类整合到了一个单独的网络中。卷积神经网络是一种拥有局部感知结构的神经网络,可以将图像数据或者点云数据作为输入,逐层的提取由局部到全局的特征,所以它是一种在图像物体检测或者三维点云物体识别领域非常有效的方法。但是由于目标所处环境的复杂多样性,还没有一种通用成熟的物体检测方法,在实际应用中物体检测算法研究的机遇与挑战并存。本篇论文对基于深度学习的物体检测算法进行了深入的研究,在图像领域改进了一种基于图像单帧的物体检测算法,并对主流图像的目标跟踪算法进行了分析,提出了一种基于视频的深度学习与数据关联相结合的检测和跟踪方法;在激光雷达点云物体识别领域改进了一种三维点云物体检测算法,本文主要研究内容及创新点如下:1)在基于单帧图像的物体检测中,改进了基于SSD的物体检测框架,通过残差网络和稠密网络对检测网络的深度进行了优化,改进了宽残差网络,并对检测网络的宽度进行了优化,并且对特征提取层进行了稠密连接,最大化的提升了特征层间的信息流动,让检测网络能够更有效地挖掘图像特征,能够提高深层卷积神经网络的识别率。2)在基于视频的物体检测中,在单幅图片检测的基础上,提出了一种将深度学习与上下文数据关联相结合的检测方法,更适应于视频中可能会出现的运动模糊,遮挡和分辨率低等复杂情况。在深度学习方面,将改进的算法用于视频中的物体检测,并且尝试了多个检测模型的融合,在数据关联方面,尝试了非极大值抑制,基于跟踪的包围框迁移以及基于上下文的非主要类别抑制等优化方法。最后,论文在大规模的视频数据集上通过实验比较了以上算法的效率以及相对原来深度卷积神经网络检测效果的提升。3)在基于激光雷达的三维点云物体检测中,改进了基于VoxelNet的三维点云物体检测框架,通过反射强度优化了点云数据的编码过程,增强了三维体素内局部点云数据反射强度的相关性,能够更好的进行点云数据的分类,并且优化了区域建议提取框架的锚点机制,能够更好的进行多类别和多尺度物体的检测以及位置的回归,有效的提升了检测模型的性能。