基于ISSD的铲车铲齿实时目标检测算法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:yhch157
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉是当前人工智能发展最迅速的领域之一。进入深度学习发展阶段后,计算机视觉在自动驾驶、人脸识别、无人机以及工业和医学检测领域都取得了令人瞩目的成就。并形成了包括图像分类、图像分割和目标检测在内的一系列关键技术。在这些领域里,目标检测是一项十分基础而又重要的工作。由于目标的非结构化输出,目标检测技术十分具有挑战性,一直是人们研究的焦点之一。
  论文基于SSD(Single Shot MultiBox Detector)算法进行优化,利用优化的SSD算法部署在Tensorflow1.14的深度学习框架上,以铲车铲齿作为目标进行目标检测和计数。从而获取铲车铲齿是否脱落的场景判断。由于SSD网络模型中有多个组件或连接,经过几次迭代后,其中一些连接变得冗余,因此论文在SSD模型中使用神经网络中的Dropout层进行剪枝删除这些连接,降低计算机运算性能要求,增强了检测的时效性。论文所开展的工作主要围绕以下三个方面:
  (1)收集带有铲齿目标的铲车工作状态视频,提取有效的视频帧数据,对铲车的铲齿边缘轮廓进行了图像增强,图像分割,特征提取等数据处理,为算法模型提供稳定的数据集。
  (2)针对铲车铲齿的实时目标检测提出集成的ISSD(Improve Single Shot MultiBox Detector Improve)算法模型,通过分析对比,利用改进的SSD单级目标识别算法与Inception_V2主干框架的集成模型进行实时目标检测与计数,并详细分析集成的模型相关的系统框架和网络设置方法。
  (3)利用Tensorflow目标检测api对网络进行了剪枝和优化,通过Tenserboard对网络的超参数进行分析,进而修改训练的配置流程,满足目标检测网络的实时性和鲁棒性场景需求。
  实验结果分析,通过采用不同检测器和不同激励函数的搭配,会产生不同效果的模型。将提出的ISSD_Inception_V2实施的目标检测模型与FasterR-CNN_inception_V2模型进行了性能上的对比分析,论证了ISSD_Inception_V2模型在实时性和精确性上有着明显的优势,可为铲车铲齿检测技术的发展提供一定的技术参考。
其他文献
水轮机微机调速器是水轮机控制系统中的重要设备,近年来PLC技术在此领域得到了广泛的应用.该文采用三菱公司的FX PLC实现了水轮机调速器的基本功能,对系统的硬件和软件进行了详细的分析和说明.文章重点研究了以下几个问题:1.根据PLC自身的特点开发设计了测频电路.2.对多种水轮机开机规律进行分析比较,以开环开机为基础提出了一种增量开二次方的开机规律,实现了机组的快速平稳启动.3.分析了并联PID的离
学位
PLC
电站锅炉煤粉燃烧过程中产生大量的氮氧化物(NO),NO对生态环境造成很严重的破坏.国内外科技工作者对煤粉燃烧过程中NO的生成机理和控制技术进行了大量的研究工作,这些研究可以分为NOx的生成机理、NO生成影响因素的实验研究、NO生成的数值模拟、煤燃烧过程NO控制技术、燃煤锅炉NO排放特性和锅炉NO生成量的预测等各方面,该文对国内外的研究进行了全面综述.煤粉的燃烧过程涉及多方面的影响因素,如稳定性、安
学位
随着无机纳米粒子在光学、生物、能源等领域的应用优势日渐凸显,对其功能化性质的要求越来越迫切。而且在评估、优化、修饰其性能时,表面裸露、无配体的纳米粒子是理想的参照材料,因此,制备无配体的纳米粒子成为人们研究的热点。经过近三十年的发展,飞秒激光液相合成纳米粒子已经发展成为一种可扩展的易操作的无配体纳米粒子合成手段。它不仅解决了传统方法提纯步骤复杂、副产物多、有配体的缺点,而且还实现了高产出、便捷、灵
作为一门新兴学科,光子技术以其极高的信息容量和效率、极快的响应速度、极大的存储能力、极强的互连能力与并行能力,取得了快速发展。在光学传感、信息传输、高速信息处理、信息存储与显示等方面得到了广泛的应用。光子技术与电子技术形成相互补充、共融与促进的关系,使其在商品市场的份额逐年快速增长。光子生物化学传感已成为当今光子学研究的重要领域之一。光子技术的快速发展极大地提高了光子生物化学传感的性能,特别是在光
该论文利用超高真空扫描隧道显微镜(UHV STM)研究了室温条件下沉积在Si(111)7×7重构表面不同覆盖度的Ag粒子.实验结果表明,低覆盖度时的Ag粒子主要有A、B两种类型,其中A型Ag粒子呈环状结构,最小的A型Ag粒子由3个Ag原子组成;而B型Ag粒子则是由两层Ag原子构成.高覆盖度时Ag粒子的生长过程为层岛混合生长(Stranski-Krastanov)模式.该文还研究了不同蒸发速率对Ag
基于音视频分析的全天智能监控系统具有广泛的应用,近年来日益得到了关注。目前视频监控已得到了充分的发展,相对而言,音频监控及其核心技术音频场景(或音频事件)分析还处于初级阶段,有待进一步发展。与此同时,音频场景识别/分析在智能家居领域得到广泛应用。为此,本文以家居环境下的音频场景分析问题作为研究对象,从以下几个方面开展了创造性工作。  1)建立家居音频场景数据库。该数据库包括2个城镇家庭和2个农村家
近年来,社区安防监控视频在“平安城市建设工程”中发挥着越来越重要的作用。随着布设范围的扩大、视频清晰度的提高,监控数据飞速增长,给传输和存储带来巨大压力。当前高清监控视频以宽带、蜂窝网络和Wi-Fi为主的接入方式,成本居高不下,制约了摄像机的布设发展。以NB-IoT(窄带物联网)为代表的智慧物联网技术的兴起,给监控系统的扩展创造了技术条件。其广覆盖、多连接、低功耗和低成本的特点,具备很好的无线接入
学位
移动通信网络的覆盖率不断提升,人们已习惯随时随地通话,因而通话场景更加复杂多样,导致环境噪声等对用户通话体验的影响更加突出。本文专注于解决近端通话场景中听音方受周围环境噪声影响听不清远端发送的语音的问题,解决这类问题的算法被称作语音可懂度增强算法。  语音可懂度增强算法通常分为两类:基于规则机制的算法和基于统计机制的算法。基于规则机制的算法利用经验主义或者度量标准构建语音时频域能量调整规则。基于统
该文介绍了生物特征识别相对于传统识别方法的优势.详细描述了虹膜的结构,说明了虹膜纹理具有高度的唯一性和稳定性,获取虹膜图像具有很好的非侵犯性,证明了虹膜识别是一种很有前途的生物特征识别方法.总结了目前国内外主要的虹膜识别系统研究进展情况,包括虹膜图像的获取,虹膜图像的定位和具体的识别编码方法.详细讨论了获取虹膜图像应考虑的各种因素,并给出了两个图像获取系统的例子加以说明.介绍了基于灰度级的虹膜定位
学位
脉冲耦合神经网络(Pulse Coupled Neural Networks,PCNN),是以生物视觉系统为基础的空时编码新型人工网络模型,具有动态变阈值、非线性调制耦合、同步脉冲发放、动态脉冲发放及时空总和等特性,使得具有相似输入的神经元同步发放脉冲,弥补输入数据的空间不连贯性,保留图像的区域信息,因此被广泛的应用在图像处理领域。双边滤波(Bilateral Filter)是一种非线性的滤波方法
学位