基于多特征融合的SSD目标检测算法研究

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:jibbsb12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是通过提取像素点组成的信息来判断场景中物体的类别与位置,该技术广泛应用于航空航天、工业检测、无人驾驶、智能视频监控以及日常生产生活中的诸多领域,通过计算机视觉减少对人力资本的消耗具有重要的现实意义。随着深度学习、计算机硬件(GPU)的发展以及大规模图像数据集的出现致使目标检测算法也得到了快速地发展。目前深度学习的的目标检测方法主要有两类:基于候选区域的目标检测算法和基于回归的目标检测算法。针对目前已有算法存在中小目标检测精度低和速度慢的问题,选择速度较快的SSD网络为主干,同时设计多感受野融合模块和多尺度信息双向融合模块,并使用数据增强方法,改善中小目标检测精度低和速度慢的问题,本文提出一种基于多特征融合的SSD目标检测算法,以下是本文的研究工作:(1)引入多感受野融合模块。单一卷积核产生的特征图中特征信息不丰富,特征表达能力弱,因此提取特征信息有限。针对提取特征信息有限的问题,引入多感受野融合模块,通过将多个并行感受野的特征信息融合到一张特征图上,将来自不同尺度感受野对应的感知信息融合,充分提取多尺度感知信息。(2)引入多尺度信息双向融合模块。高层特征图缺乏中低层细节特征信息,低层特征图缺乏高层语义信息,因此单一尺寸特征图所包含信息不丰富。针对特征图信息不丰富的问题,检测过程中正需要中低层特征信息和高层语义信息兼具才能实现更好的效果,引入多尺度信息双向融合模块将高层特征图语义信息传递到低层特征图,将细节特征信息传递到高层特征图,进行双向融合,丰富低层和高层特征图的特征信息。(3)使用数据增强方法。目前已有数据集存在大小目标数量分布不平衡的问题,为了缓解该问题使用数据增强方法丰富中小目标数量,使训练集的中小目标背景多样化。如此以来训练后的分类器对中小目标检测更加友好,增强模型在中小目标上的泛化能力,提高了中小目标的检测精度。通过设计实验与近些年主流的目标检测算法,以及与其他基于SSD的单阶段改进的算法进行对比分析。实验结果表明,本研究的方法在保持较快速度的同时有效提高了中小目标的检测精度,在基于SSD的改进的算法中有着很好的表现,能够提高目标检测的检测精度。
其他文献
随着当今社会人工智能的迅速发展,各行业对无线定位技术的需求不断增加。目前飞机机翼的装配复杂,尺寸较大,在实际的装配过程中定位难、在装配时需要大量工人协作装配,工人仅根据经验或纸张看板装配,会出现错装、漏装等情况。为了满足工人对装配资源的定位以及装配信息可视化的需求,采用基于RFID技术和UWB(超宽带)技术的复合定位方案实现状态信息的获取,以建立实时更新的、现场感强的“真实”飞机机翼模型,利用真实
学位
传统的装配辅助系统都是基于两个方向——虚拟装配辅助系统和PC端的装配辅助系统。虚拟装配辅助系统只能作为前期培训使用,并不能将装配过程与其结合,所以该技术有着较大的局限性。而基于PC端的装配辅助系统虽然也可以在装配过程中查看各种必要的信息,但是这也意味着用户必须停下手中的工序去操作电脑,这大大降低了整体的效率,同时其也存在着不够形象、晦涩难懂的缺点。本文针对以上两种装配辅助技术存在的不足和未来传统制
学位
随着现代社会不断发展,手机、电脑等电子设备已经成为人们日常生活中不可或缺的一部分,同时摄像头等设备在大街小巷发挥着重要作用。超市中,摄像头可以实时记录突发情况;教室中,摄像头可以实时的记录学生的行为活动。监控摄像头中含有大量信息,通过监控视频分析人体行为异常信息已逐渐成为了各个领域的热门话题。人体异常行为检测的研究对于室内场景下分析人体行为提供了有利条件,逐渐成为了一个重要的研究课题。所谓人体异常
学位
眼底图像中的视网膜血管是人体重要的反射区,可以根据视网膜血管的病变程度,了解其他部位的疾病。随着深度学习人工智能技术的发展,计算机技术辅助医疗疾病的诊断已成为一种趋势。本文对图像分割以及视网膜血管分割的国内外现状进行了深入的总结,介绍了深度学习视网膜血管分割相关的理论知识。目前视网膜血管分割方法还存着分割准确率不高、灵敏度较差、错误识别分割区域等问题。针对这些问题,运用深度学习方法,对视网膜血管进
学位
水声传感器网络(Underwater acoustic sensor network,UASN)作为水下物联网感知层的重要组成部分,在海洋工程监测、开发海洋资源、预防自然灾害等多个领域具有广阔的应用前景。UASN在实际应用中需要部署大量节点,并且需要节点间高效的信息交互,协同完成具体任务。因此面向UASN的分簇、路由技术成为学术界研究的热点。水声信道长时延、窄带宽、高误码率等特点,使得传统的传感器
学位
装配序列规划是机械产品装配工作中的基础环节,亦是决定装配质量的重要环节,装配序列的合理规划直接影响装配的效率和成本消耗,因此如何使装配序列规划过程更加精确与高效成为了现在制造业研究的重要问题。智能优化算法的应用为具有约束条件限制的装配序列规划问题提供了一种高效的路径寻优方法,装配仿真技术为验证装配序列的准确性提供了保障。本文以机翼为研究对象,提出了利用蚁群遗传混合算法对机翼装配序列进行优化的方法,
学位
随着无人机及其相关技术的快速发展与日渐成熟,其在军事、商业、民用等领域正扮演者越来越重要的角色。在无人机的实际应用中,往往需要众多无人机之间互相通信、相互协作共同完成复杂的任务。因此面向无人机组网的路由技术越来越受到重视,并成为当下研究的热点。由于完成任务的复杂性、网络拓扑的高动态性、无人机节点容易受到外部损伤等特点,,研究无人机组网下的拓扑、路由技术来提高数据传输的可靠性、网络抗毁性具有十分重要
学位
在日常生活中,网络购物是一种重要的购物方式,但是网络购物看不到真实的商品,用户只能通过阅读为产品编写的在线评论,以决定是否购买该产品。评论实际上影响着用户的购买决策,关联着商家的销售额,往往正面积极的评论对提高销售额是更有帮助的。因此,为了获得利益,一些商家开始雇佣水军,制造虚假评论,这些评论无关商品优劣,并不是用户对待商品真实的想法,严重影响了用户的网络购物体验。为了检测这类虚假评论,研究者已从
学位
随着社会经济的不断发展,城市人口和机动车保有量也在持续增加,从而导致交通拥堵成为阻碍城市发展的主要问题之一。为了解决该问题,作为智能交通系统重要组成部分的短时交通流预测技术得以快速发展。但是由于交通轨迹数据的数据规模大、时空依赖性强以及易受外界环境因素影响等原因,导致短时交通流预测的准确率很难得到保证。虽然目前已有许多用于处理轨迹数据并且实现短时交通流预测的研究方法,但是这些方法大多是以交通流数据
学位
随着传感器和遥感技术的不断发展,遥感图像的空间分辨率和光谱分辨率随之得到了很大的提升。光-谱双分辨率的提高,使得遥感图像的数据量成倍增加,导致了一些原有处理遥感图像分类的方法、手段、工具出现了应对不良的情况。而深度学习的出现,很好地解决了上述问题。虽然深度学习相关分类算法有高精度的优势,但是在算法的训练过程中,需要对应的标签。这就意味着,需要耗费大量的人工成本,这也一直是遥感图像分类过程中的一大难
学位