论文部分内容阅读
矿产资源在国民经济和社会发展中占有极其重要的地位,矿产资源急剧上升的需求,导致了一系列矿井安全问题。诸如无人开采机械、无人驾驶矿车等自动化生产手段有利于减少矿井事故的发生,而计算机视觉是支撑自动化生产的有效技术手段,其中矿井行人检测是计算机视觉的基本任务。传统基于特征提取的行人检测算法应用在矿井巷道复杂多变、照明恶劣的场景下存在诸多弊端,无法保证检测结果的准确性。幸运的是,人工智能的发展给矿井行人检测带来了黎明的曙光,深度神经网络与深度学习算法已经应用于工业现场各个领域,然而在矿井行人检测领域却少有研究。本文针对上述问题,提出了基于并行特征传递深度神经网络的矿井行人检测算法,在保证检测精度的前提下兼顾检测速度与鲁棒性。主要研究内容如下:(1)提出基于锚点框自动生成的非预训练井下行人检测网络Gas Net(Guided Anchors Network),实现提升目标检测网络的结构适应性,减少预训练工作量,降低迁移学习带来的“负迁移”风险。Gas Net主要由非预训练的骨干网络和并行处理的检测网络组成,检测网络包括锚点定位预测和锚点形状预测两个分支组成的锚点框生成模块和特征图适应模块。通过井下数据集验证,网络检测精度达64.7%,检测性能良好。(2)提出结合并行特征传递的矿井行人检测网络Pft Net(Parallel Feature Transfer Network),实现了在保持精度的前提下提高检测速度。Pft Net由行人辨识模块、行人定位模块和特征传递块组成,所提网络模型可达到37帧/s的实时检测速率,并且保持63.4%的检测精度,并且在UMP2018和公共行人数据集上进行实验验证网络的鲁棒性。最后,通过对论文进行总结,并对接下来的研究工作进行展望。