基于YOLOv5自适应损失权重的生活垃圾目标检测模型研究

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:zoneshao1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机算力的提升,深度学习技术在目标检测领域得到了全面的应用,让目标检测技术的发展实现了飞跃,并应用到了文本检测、行人检测、自动驾驶等诸多领域中。但是,在生活垃圾目标检测领域还存在需要改进的问题:一方面在检测精度上还存在改进空间;另一方面由于生活垃圾目标检测领域的应用研究相对较少,导致生活垃圾数据集少且规模小,而生活垃圾自动分拣流水线上的目标检测构件对模型精度要求较高,需要较丰富的训练数据集进行模型训练,提高检测精度。针对以上问题,本文以YOLOv5模型为基础,做了以下研究改进工作。(1)针对生活垃圾目标检测精度不足的问题,本文提出了基于YOLOv5的自适应损失权重模型(YOLOv5 Adaptive Loss Weight Model,ALW-YOLOv5),在原模型的基础上设计引入了3个新模块,分别是GT边界框ID生成器、GT边界框ID匹配器、自适应损失权重算法。GT边界框ID生成器在数据加载阶段负责给真实标注边界框生成全局唯一ID;GT边界框ID匹配器在模型计算损失时负责匹配预测边界框,达到分簇目的;自适应损失权重算法通过对位置损失与分类损失进行权重自适应调节,实现梯度激励效果,提升了检测精度。(2)针对生活垃圾数据集少且规模小的问题,本文提出了一种图片拆分再组合的数据增强方法(Disassembly-Mix Data Augmentation Method,DMDA)。该方法能够在现有数据集的基础上,通过标注信息从图片中拆分前景目标,再进一步对拆分所得前景目标实施遮挡、旋转等策略生成组合图片,并完成自动标注工作。本文将DMDA方法应用在华为生活垃圾目标检测数据集上,生成DMDA增强数据集,训练ALW-YOLOv5模型,进一步提升了该模型的检测精度,同时证明了DMDA方法对于生活垃圾识别精度提升的有效性。(3)对上述两个改进工作进行实验分析,验证ALW-YOLOv5模型和DMDA方法的有效性。使用ALW-YOLOv5模型在VOC2007标准数据集上进行实验,分析、验证了新的ALW-YOLOv5模型可有效提升目标检测m AP精度;进一步将ALW-YOLOv5模型应用到华为生活垃圾目标检测数据集,并通过DMDA方法对华为原始数据集进行增强,实验表明DMDA方法可进一步提升既有模型的目标检测精度。研究实践证明,ALW-YOLOv5与改进前相比,在VOC2007数据集上取得了m AP最高12.89%的相对提升;在华为生活垃圾目标检测数据集上,ALWYOLOv5+DMDA比ALW-YOLOv5模型取得了最高2.96%的增进提升。实验结果表明ALW-YOLOv5模型与DMDA数据增强方法能有效提升精度,且ALWYOLOv5+DMDA可有效强化ALW-YOLOv5目标检测能力。
其他文献
软件测试是软件开发中非常重要的一项任务,能帮助开发者全面、快速地找到软件漏洞,从而有效提升软件质量和用户体验。设计和选择合理的测试用例,可提升软件的测试效率,减少开发人员的工作量。随着软件功能的不断完善,其规模和复杂度不断增加,传统用例生成方法效率较低,很难满足目前软件测试的需求,故而,如何提高测试用例生成效率仍需进一步研究。基于此,本文针对路径覆盖测试用例自动生成效率问题展开探讨。针对回归测试中
学位
随着传感器技术的飞速发展,人们获得信息的通道越来越多。不同的传感器能够反映场景中不同方面的信息,可以帮助人们更加全面地了解物体的本质。虽然不同传感器图像之间存在着互补信息,但图像和图像之间不可避免的存在冗余信息。红外传感器捕捉场景中的热辐射信息,因此红外图像具有较高的对比度,且能够将显著目标与背景分离。可见光传感器捕捉场景中的光反射信息,因此可见光图像具有较丰富的纹理信息。红外和可见光图像融合旨在
学位
新媒体时代下,社交媒体的高度活跃,吸引了大批有着共同兴趣爱好的网民,“同好者”通过社交网络齐聚一堂,彼此联系,实现信息的交流与互动,这令每个人都不可避免地成为信息的传播者和接收者,且随时随地都能参与到媒介内容的生产过程中去。如此一来,网络中的信息量呈指数型不断增长,但在这急剧增长的信息中却夹杂着大量包含色情、暴力乃至反动等内容的敏感信息。人们的身心健康和财产安全极易遭受这些信息的威胁,不仅如此,带
学位
当今世界,国外在核心技术上对中国进行各种封锁,中国需要凭借自己的能力冲破阻碍,“十四五”规划中也提到科技创新的重要性。创新促进科技的进步,而学科竞赛是培养学生创新能力的重要途径,参加学科竞赛有利于激发学生的创新活力,优化学校的创新生态。现如今,人们的生产生活方式由线下逐步转为线上,人们逐渐习惯了在线上就能完成所要做的工作。因此,本文从学科竞赛中的组队入手,旨在打造一个帮助学生参与竞赛,帮助学校管理
学位
可搜索加密是一种支持用户在密文上进行关键字查找的密码学原语,它能够有效解决无法直接在基于传统加密方案加密的数据中进行查询的问题。在云端的密文数据集中,当用户由于自身缘故导致输入查询关键字有偏差时,仅支持精确查询的可搜索加密会导致搜索结果和用户预期相差较远,甚至没有搜索结果。而支持模糊关键字查询后,云服务器将根据查询关键字搜索与其尽可能相似的文件,从而有效避免上述问题。搜索精度和搜索效率是衡量可搜索
学位
法律文书是司法机关及律师等在解决案件时使用的文书,包含大量司法信息,如何高效地分析和利用这些信息具有重要研究意义。现有的法律文书智能化处理大多集中在法律实体识别和法律实体关系抽取上,对于事件抽取的研究非常少。民事判决书作为日常中最为常见的文书类型,具有一定的普适性,同时判决书作为判案的判决结果,将其作为数据来源可以获得案件细节的详细描述。本文从北大法宝上下载民事判决书作为原始语料,针对民事判决书进
学位
安全生产关系人民利益、关乎社会平稳发展。同时,也是企业能否平稳发展的基础。随着信息化、智能化的不断加深,隐患自查、自检上报平台的应用,企业监管部门以及企业都存储了大量的企业隐患文本数据。如何充分利用这些数据甄别出不负责的企业,为政府监管部门在有限人力资源的情况下实现精确检查、精准执法提供依据,对企业提高自我防范意识、避免生产事故发生具有极为重要的意义。针对安全隐患文本内容较短、特征矩阵稀疏等特性且
学位
装箱问题(Bin-packing problem)是一类经典的带几何约束的组合优化问题。可以将这类问题看作在一定的约束条件下,将若干不规则零件以某种互不重叠的方式放入一定大小的空间中,使得总体空间利用率最大化。装箱问题被广泛应用于面料裁剪、印刷排版、机械制造等工业领域也是任务调度、资源分配等计算机科学领域的重要环节。其中,二维装箱问题具有很高的复杂性,属于NP难问题,用一般的数学方法进行求解较为困
学位
随着信息化程度的日益提高,计算机软件已经被广泛应用于技术产业和国民生活的各个方面,软件系统的规模和复杂程度也在不断提高。软件测试作为提高软件质量、保证软件可靠性的重要手段,在软件开发过程中发挥着重要作用。在众多软件测试技术中,蜕变测试(Metamorphic Testing,MT)作为能有效减轻软件测试中预期输出问题压力的测试技术,目前被广泛应用在人工智能、搜索引擎等缺乏测试预言(Test Ora
学位
随着计算机视觉技术的发展,光学字符识别(Optical Character Recognition,OCR)的精度和速度逐步提高,在文档扫描、证件识别中得到了广泛的应用,然而,当文档中包含大量公式时,因公式具有复杂的结构,现有的文档识别系统在识别公式时时常语义不明,甚至出现乱码,精度依然有待提高。现阶段针对包含公式的文档识别的研究主要采用先拆分、后识别的步骤,其中对于公式块的识别主要以基于深度学习
学位