基于深度卷积神经网络的目标检测技术及其应用研究

来源 :西华师范大学 | 被引量 : 0次 | 上传用户:ajing819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
得益于深度学习,目标检测研究取得了巨大的突破,但是在实际生活场景的应用中,并未达到人类实现高效管理最理想的效果。比如交通参与者是道路交通活动的基础,随意运行的车辆和行人容易打破良好的交通秩序,对其进行检测有助于优化城市管理,建设新型智慧城市。比如,绝缘子是架空输电线路的绝缘控件,需要承受超高的机械强度,自爆后需要及时更换,否则将会难以管控线路的输电调度。人工智能赋能行业发展,目标检测作为其基础课题,要使其在各种复杂场景下发挥最大效益的目标还面临着很大的挑战。本文在当今使用深度学习技术“看”世界的背景下,对现有基于神经网络的目标检测算法进行改进,并将改进的算法应用在城市道路交通参与者检测识别、复杂背景下多车牌检测定位和中国南方电网自爆绝缘子分割检测。1)汽车自动驾驶中,错误的目标检测可能导致严重事故,因此高精度的目标检测在汽车自动驾驶中至关重要。提出一种嵌入注意力和特征交织模块的GaussianYOLOv3目标检测方法。该方法主要对特征图通道的处理方法进行改进:首先在网络中添加注意力模块用于自主学习每个通道的权重,增强关键特征、抑制冗余特征,从而加强网络对前景目标和背景的区分能力;其次,同时将特征图的不同通道进行特征交织得到更具表征性的特征;最后,对注意力和特征交织模块分别得到的特征进行再融合,从而构成新的特征图。2)为了准确检测出复杂背景下的多个颜色不同、大小各异的车牌,提出一种基于YOLOv3的改进网络,得到一种兼顾精准度、网络复杂度和检测时间的多车牌检测方法。主要改进包括:将Inception-Res Net模块融入YOLOv3形成新的特征提取网络提取车牌特征;将SPP模块添加到YOLOv3模型的检测网络形成新的多尺度检测网络;统计车牌大小,并聚类分析,根据车牌大小设计先验框尺寸;对改进网络的重复模块进行裁剪实验,在确保检测性能的同时,最大限度减少训练参数和检测时间。3)以从复杂背景图像分割出来的绝缘子串中找到并标识出自爆绝缘子缺失的位置为研究内容,提出一种基于图像亲密度分布建模和轮廓边界建模的绝缘子串分割检测模型,通过亲密度建模和轮廓建模来学习绝缘子的外观共性和轮廓共性,使网络能够感知前景实例的整体性和与背景区域的可分离性;最后从绝缘子串掩膜图中定位自爆绝缘子缺陷检测方法。
其他文献
波动方程是描述自然界中各种波动现象的一种双曲型偏微分方程,其发展应用于各个领域,但其解析解难以求得,因此波动方程的数值求解显得越发重要。人工神经网络是能够以任意精度逼近偏微分方程的解析解,是求解波动方程数值解的一个重要工具。本文主要就人工神经网络算法求解波动方程以及该算法的改进作出如下的研究:第一章主要介绍了神经网络的背景知识及其发展的国内外现状,并简述了本文所做的工作。第二章介绍了神经元模型及单
机器人的诞生让人们的生活更加智能化。其中,具有自主移动功能的移动机器人更是当下非常热门的科技成果。路径规划是移动机器人执行各项任务的前提,它决定了移动机器人是否能够在作业区域内安全、高效地执行任务,对移动机器人的性能具有十分重要的影响。现有国内外文献对移动机器人的发展动态和路径规划均作了大量的研究,但对移动机器人从某个起点出发、经过多个目标点并避开障碍物、最终返回起点的情形研究还较少,本文选取这类
随着人工智能技术的不断发展,传统的机械臂应用变得越来越智能化,其中的一个关键智能化提升就是使机械臂获得在非结构化空间环境中对某种目标物品按某种物理属性进行快速分拣的能力。本文采用深度强化学习算法DDPG(Deep Deterministic Policy Gradient)代替在机械臂控制中的逆运动学解算方法,通过数据驱动的训练过程控制机械臂到达目标位置,从而抓取目标物体,达到分拣目标物品的目的。
智能建筑是“以建筑物为平台,兼备信息设施系统、信息化应用系统、建筑设备管理系统、公共安全系统等,集结构、系统、服务、管理及其优化组合为一体,向人们提供安全、高效、便捷、节能、环保、健康的建筑环境”。智能建筑的环境监测系统是智能建筑的重要子系统,它对建筑体内外环境提供全天候监测,为环境异常预测、节能降耗、安全管控、便捷生活等提供数据支持,有效保障建筑体及内部人群的生命财产安全,一直是现代建筑领域、信
近些年,随着通讯技术的快速发展,互联网上的内容越来越丰富,互联网已成为人们获取信息的主要途径。随着信息的指数级增长,对信息进行分类整理,减少信息检索的时间成本,提高信息资源的利用效率就显得越来越重要。文本是信息传递的重要载体,传统的文本分类模型需要人工进行特征工程,效率低下。所使用的特征提取方式具有高维度、高稀疏性的缺点。目前,基于深度学习的RNN(Rerrent Neural Network)和
脑肿瘤是威胁人类生命安全的常见肿瘤之一。传统的脑肿瘤诊断方式是医生根据病人身体的不良症状以及眼底的并发症进行判断。随着医学技术的发展,现阶段对脑肿瘤的诊断方式变为了由医生根据病人的脑部MRI图像进行判断,但这种方式随着医生日常增多的工作量以及各个医生临床经验的不同,误诊、漏诊的情况在长期的临床诊断中时有发生。计算机辅助诊断系统(CAD)可以准确识别图像,协助医生进行日常阅片工作,缓解工作压力,提高
随着人脸识别技术日渐成熟,人脸识别已广泛应用到访问控制、人脸支付和设备解锁等场景中。因此,人脸识别系统的安全性引起了越来越多的关注。人脸识别系统主要基于图像特征的提取与匹配,完成身份认证。这种认证方式容易受到欺骗攻击,如在认证系统前呈现伪造的人脸照片、视频或3D面具等,导致虚假认证。人脸活体检测通过分析摄像机捕捉的人脸信息,进而判断认证者是否为活体用户,是人脸认证系统抵御欺骗攻击的重要技术手段。目
眼底视网膜血管的不同形态(如直径、长度、分支等)具有十分重要的临床意义,可用于监测和分析各种心脑血管疾病和眼科疾病。自动分割眼底图像中的视网膜血管,可以有效帮助医生对各种心脑血管疾病和眼科疾病病人做出更全面的诊断和进一步的治疗,增加治愈的可能性。在研究过程中发现由于采集设备、拍摄角度和光照等的差异对眼底图像获取的影响,想要对眼底图像的视网膜血管进行精准分割就显得十分困难。而且现有模型存在分割过程中
汽配件喷涂是汽车零配件生产流程中重要的环节,对汽配件颜色喷涂生产问题进行优化,有助于企业进一步降低生产成本,而目前尚无文献对该类问题提出针对性的数学模型和解法,故针对汽配件喷涂生产问题提出高效的求解方法对实际生产具有理论指导意义。首先,将实际单轮汽配件喷涂生产问题转化为数学问题,考虑到每一个汽配件必须喷涂且只喷涂一次,具有旅行商问题(TSP)的基本特征,故采用借鉴TSP问题建模的方法对单轮汽配件喷
在推荐系统中,高维稀疏矩阵常用来描述用户和项目实体间的二元关系,隐特征分析方法能够对高维稀疏矩阵中缺失值进行估计,通过缺失预测达到对用户进行个性化推荐效果。随机梯度下降法是求解隐特征分析模型的有效策略,然而基于随机梯度下降算法的隐特征分析模型很大程度上依赖于超参数学习率的选择。粒子群优化算法(PSO)因其收敛快速和实现简单的优点已经被成功用于隐特征分析模型的超参数学习率的自适应调谐,但是由于标准P