论文部分内容阅读
计算机视觉是当前人工智能发展最迅速的领域之一。进入深度学习发展阶段后,计算机视觉在自动驾驶、人脸识别、无人机以及工业和医学检测领域都取得了令人瞩目的成就。并形成了包括图像分类、图像分割和目标检测在内的一系列关键技术。在这些领域里,目标检测是一项十分基础而又重要的工作。由于目标的非结构化输出,目标检测技术十分具有挑战性,一直是人们研究的焦点之一。
论文基于SSD(Single Shot MultiBox Detector)算法进行优化,利用优化的SSD算法部署在Tensorflow1.14的深度学习框架上,以铲车铲齿作为目标进行目标检测和计数。从而获取铲车铲齿是否脱落的场景判断。由于SSD网络模型中有多个组件或连接,经过几次迭代后,其中一些连接变得冗余,因此论文在SSD模型中使用神经网络中的Dropout层进行剪枝删除这些连接,降低计算机运算性能要求,增强了检测的时效性。论文所开展的工作主要围绕以下三个方面:
(1)收集带有铲齿目标的铲车工作状态视频,提取有效的视频帧数据,对铲车的铲齿边缘轮廓进行了图像增强,图像分割,特征提取等数据处理,为算法模型提供稳定的数据集。
(2)针对铲车铲齿的实时目标检测提出集成的ISSD(Improve Single Shot MultiBox Detector Improve)算法模型,通过分析对比,利用改进的SSD单级目标识别算法与Inception_V2主干框架的集成模型进行实时目标检测与计数,并详细分析集成的模型相关的系统框架和网络设置方法。
(3)利用Tensorflow目标检测api对网络进行了剪枝和优化,通过Tenserboard对网络的超参数进行分析,进而修改训练的配置流程,满足目标检测网络的实时性和鲁棒性场景需求。
实验结果分析,通过采用不同检测器和不同激励函数的搭配,会产生不同效果的模型。将提出的ISSD_Inception_V2实施的目标检测模型与FasterR-CNN_inception_V2模型进行了性能上的对比分析,论证了ISSD_Inception_V2模型在实时性和精确性上有着明显的优势,可为铲车铲齿检测技术的发展提供一定的技术参考。
论文基于SSD(Single Shot MultiBox Detector)算法进行优化,利用优化的SSD算法部署在Tensorflow1.14的深度学习框架上,以铲车铲齿作为目标进行目标检测和计数。从而获取铲车铲齿是否脱落的场景判断。由于SSD网络模型中有多个组件或连接,经过几次迭代后,其中一些连接变得冗余,因此论文在SSD模型中使用神经网络中的Dropout层进行剪枝删除这些连接,降低计算机运算性能要求,增强了检测的时效性。论文所开展的工作主要围绕以下三个方面:
(1)收集带有铲齿目标的铲车工作状态视频,提取有效的视频帧数据,对铲车的铲齿边缘轮廓进行了图像增强,图像分割,特征提取等数据处理,为算法模型提供稳定的数据集。
(2)针对铲车铲齿的实时目标检测提出集成的ISSD(Improve Single Shot MultiBox Detector Improve)算法模型,通过分析对比,利用改进的SSD单级目标识别算法与Inception_V2主干框架的集成模型进行实时目标检测与计数,并详细分析集成的模型相关的系统框架和网络设置方法。
(3)利用Tensorflow目标检测api对网络进行了剪枝和优化,通过Tenserboard对网络的超参数进行分析,进而修改训练的配置流程,满足目标检测网络的实时性和鲁棒性场景需求。
实验结果分析,通过采用不同检测器和不同激励函数的搭配,会产生不同效果的模型。将提出的ISSD_Inception_V2实施的目标检测模型与FasterR-CNN_inception_V2模型进行了性能上的对比分析,论证了ISSD_Inception_V2模型在实时性和精确性上有着明显的优势,可为铲车铲齿检测技术的发展提供一定的技术参考。