基于改进YOLOv5s的可回收垃圾检测与应用研究

来源 :广西大学 | 被引量 : 1次 | 上传用户:xxc1990531
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾回收的好处很多,其有助于保护水土资源,提高居民的生活环境质量,加快绿色循环经济发展。然而传统的垃圾回收需要大量人力和物力。为了获得更高的精度,目标检测模型通常带有巨大的参数量和复杂的结构。本研究提出了一个更轻量和高效的YOLOv5s改进模型,将其用于对可回收垃圾的分类和定位,并结合可回收垃圾检测的应用开发进行相关的实践。主要的工作如下:1、对原YOLOv5s网络中,参数量较大的问题、计算复杂的部分,合理结合Shuffle Net V2基本单元、深度可分离卷积与Hard-Swish激活函数对YOLOv5s结构进行改进,降低网络的冗余性,使得结构更加紧凑。2、在原YOLOv5s网络中,对特征图通道数目较多的结构但是没有区分不同通道重要性的问题,通过嵌入轻量级的SE注意力机制,使得网络能区分不同通道的重要性,给予不同的权重。3、采用遗传算法和K-means++聚类算法,重新获得更准确的可回收垃圾锚框,便于网络边框回归调整。4、为了提高可回收垃圾检测模型的性能,采用迁移学习的方式,迁移学习选择的数据集为COCO数据集,使其预先学习COCO数据集中80个类别的丰富特征。5、针对于可回收垃圾检测模型的实际嵌入式应用开发,选用常见的Jenson Nano与树莓派4B作为微型的嵌入式平台,并进行实际的运行速度对比研究,且为了便于使用者的操作、观察效果和调节阈值,使用Pyqt5库创建图形化界面,实现可回收垃圾检测的便捷操作。6、为了研究实现在网络上的可回收垃圾检测任务,采用Flask后端与VUE前端构建了可回收垃圾检测的WEB平台。实验结果表明,改进的模型参数量压缩为原始模型参数量的60.3%,模型内存也压缩了59.2%。在输入分辨率为640×640时,在精度上,改进模型的m AP为96.43%,比原始YOLOv5s高出4.34%,在速度上,改进模型提高了在GPU平台上的并行度,通过在Jetson Nano硬件上进行部署,改进模型的前向推理速度比原始YOLOv5s加快了13.1%。另外,与目前主流的目标检测模型对比,提出的改进模型也具有很好的可回收垃圾特征表达能力,可为可回收垃圾检测的轻量化开发提供参考。
其他文献
在机器学习的许多实际应用中,存在着许多数据不平衡的问题。传统机器学习算法往往以总体的分类准确率为目标,在对不平衡数据分类时容易忽略少数类。虽然当前对分类任务的数据不平衡问题研究较多,但对于回归任务的数据不平衡问题的研究较少。而在热带果树寒冻害预警问题中,气象数据集通常是不平衡的,即对热带果树造成寒冻害的天数较少,果树正常生长的天数较多。故针对传统机器学习算法在分类不平衡数据时容易忽略少数类的问题,
学位
随着车辆的普及和无线通信的发展,车载自组织网络VANET得到了广泛应用,但是车载自组织网络需要提供相应的网络服务质量(Quality of Service,QoS)来满足网络应用需求。而车辆的高速移动导致车辆自组织网络的网络拓扑结构动态变化,所以车载自组织网络QoS路由相比传统的QoS路由更加难以求解。研究适合车载网动态拓扑结构和复杂网络环境的QoS路由算法,对于提高车载自组织网络的应用性能有着重
学位
多项式乘法计算应用于许多通信系统、信号电路以及图像处理算法中。在多项式乘法计算中,系统往往需要对大量数据进行高效处理,并输出结果。研究多项式乘法计算的关键,在于多项式矩阵乘法的应用与运算。随着多项式矩阵乘法结构日趋复杂,大型矩阵的高效运行和计算正不断面临更大挑战。由于多项式具有多变量、大规模等特点,目前仅依靠软件算法尚不足以满足实际需求。因此,亟需一种硬件加速平台的方式,以适应于多项式乘法日趋复杂
学位
随着我国经济社会的高速发展,对道路交通质量提出了更高的要求,因此修建了大量的桥梁,由于桥梁特殊的工程结构、自然灾害以及长期高荷载运行的影响,会造成桥梁结构损伤,比如拉索的激振和腐蚀,对桥梁的安全运行形成威胁。因此,对桥梁运行状态进行监测是一项非常必要的工作。为此,论文针对桥梁的安全运行设计了一套监测系统,该系统主要包括以下3个部分:1、混凝土泵送压力状态监测模块;2、基于应变片的桥梁拉索索力测量模
学位
随着社会的发展,公有公共设施在日常生活中发挥着越来越重要的作用,与之伴随的是公有公共设施致害的情况越来越多,目前,我国《国家赔偿法》的赔偿范围尚不包括公有公共设施致害,公民面对致害问题时只能通过民事法律来解决。由于民事法律具有一定的局限性,因此有必要将公有公共设施致害的问题纳入国家赔偿的范围,对实体和程序上的问题明确法律适用。
期刊
射频识别(Radio Frequency Identification,RFID)是实现物联网的关键技术,RFID技术应用范围广泛,如车辆管理、生产管理、人员管理、食品安全等领域。RFID网络规划(RNP)是RFID研究领域最具有挑战的难题之一,RNP是一个典型的多目标优化问题,为了让RFID系统有效覆盖标签,应找到规定区域内阅读器的总数以及它们应该放置的最佳位置。本文为解决RFID网络规划问题,
学位
信道编码技术是实现未来通信系统性能更高标准的关键技术之一。因此,信道编码技术应具有编码增益大、复杂度低、时延低、数据吞吐量高以及编译码灵活性强等特征。而作为典型的信道编码方案LDPC码(低密度奇偶校验码)具有译码复杂度较低,且易于采用并行译码的技术特点,通过精心设计的LDPC码可实现很低的错误平层,完全可满足高吞吐量及可靠性方面的需求。基于上述LDPC码的优异性能,目前,准循环LDPC码已被确定为
学位
期刊
面部表情能自然而高效地反映人们的心理活动和思想状态,在诸多智能化应用中,人脸表情识别(Facial Expression Recognition,FER)是人类与机器间建立起情感交互的重要基础。FER在个性化推荐、社交应用、医疗健康、自动驾驶等诸多新兴交互系统中具有良好的应用价值。近年来,深度卷积神经网络(Convolutional Neural Networks,CNN)技术取得长足发展,这为F
学位
步态识别是一种新兴的身份认证技术,它的核心思想是利用人们行走时展现的步态信息进行身份认证。Kinect设备可以实现人体骨骼的空间定位和追踪,同时实时输出步态运动的3D骨骼信息,为人物识别提供了有效的骨骼数据。本文针对目前Kinect 3D骨骼的步态识别研究在数据归一化和特征提取方面存在的问题,提出了两种基于Kinect 3D骨骼数据的人物识别方法——基于关节点坐标图像的单帧人物识别方法和基于步态时
学位