基于深度学习的垃圾分类算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:deansam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾回收与重新处理,始终是人类社会一个不可忽略的问题。尤其是进入21世纪以来,人类生产力飞速提升的同时,垃圾数量迅速增长。妥善的处理垃圾,可以高效的利用资源,减少污染,甚至再次创造效益。而且垃圾处理工作环境一般比较恶劣,有时候运送来的垃圾中掺杂一些的玻璃废渣,废旧电池等,这会使垃圾分拣工作者有一定受伤的风险。因此,建立全自动的智能垃圾分拣系统就显得十分重要。本文设计了一套智能垃圾自动分拣系统,重点设计了图像识别和机械臂智能分拣子系统,其工作过程如下:将垃圾运送到传送带上,相机安置在传送带上方,通过相机进行垃圾图片拍摄,经过垃圾分类算法,对图片中的垃圾进行识别和定位,并将处理后的信息传给后面的机械臂进行抓取。这样可降低人工成本,提高工作效率。但是,此系统对垃圾分类算法提出了很高的要求,需要算法具有高识别率,快速性和鲁棒性。近年来,基于深度学习的物体检测算法如火如荼进行,目前已经有很多优秀的目标检测网络,但是应用在垃圾检测领域的却很少。因此,开展基于深度学习的垃圾分类算法研究,既有重要的理论意义和实用价值。本文首先调研了垃圾分拣领域的现状,尤其是当前垃圾分类算法和垃圾分拣装置在国内外的研究现状,阐述了垃圾分类算法的设计思路;研究了垃圾分类算法的数学基础与基本单元;介绍了神经网络的优化技术,从数据增强、Dropout技术和归一化数据输入三个方面阐述了如何防止过拟合,为之后垃圾分类算法的设计奠定基础。然后,研究了垃圾分类网络的设计过程。根据实际情况,设计了垃圾检测数据集;研究了经典的图像分类网络,并从中选取出分类性能最佳的网络作为baseline;针对分拣现场垃圾背景复杂、形态各异、特征提取困难的问题,引入了注意力模块来提高网络对于目标特征的抓取能力;设置了对比实验,研究了注意力模块对垃圾分类网络的影响,并设计出最终的HGCNet(Hit Garbage Classification Net)垃圾分类网络。其次,研究了垃圾检测追踪算法的设计过程。以第三章设计出的HGCNet作为主干特征提取网络;针对网络中深层特征层与浅层特征层的对于信息概括性的区别,使用了特征加强与特征金字塔等网络来对不同特征层之间进行融合,从而设计出特征提取网络;针对网络在训练过程前景和背景分布差距大,对类别损失函数进行了优化和设计;为了加快网络收敛速度,充分考虑了检测框与真实框的IOU关系、中心点距离、框的长宽比三个因素,对回归损失函数进行了设计;针对实际工作中系统对实时性的要求,使用迁移学习的思想,对网络进行了轻型化设计;考虑到实际垃圾抓取过程对垃圾目标有连续追踪的需求,研究了多Sort算法和Deep Sort算法,并对其进行了分析;将前面设计的垃圾检测网络作为检测器,设计出改进的Deep Sort算法作为最终的垃圾检测追踪算法。最后,对垃圾分类系统进行设计。调研了目前城市垃圾的基本类别,根据不同垃圾的特性设计了智能垃圾分类系统;重点介绍了图像识别和机械臂子系统,并详细介绍了硬件选型;对垃圾分类综合监控系统进行了设计,阐明了系统的设计思路、功能,并对每种工作模式进行了系统测试。
其他文献
随着人工智能的快速发展,卷积神经网络在自然语言处理、计算机视觉、医学治疗等任务中扮演着至关重要的角色,尤其在计算机视觉领域取得了令人瞩目的成绩,例如目标检测、特征识别、图像检索等。但是,随着卷积神经网络在应用上的愈发深入,其结构愈发复杂,模型的计算量更是指数级上升,其对算力和存储空间的要求也越来越高。在过去半个世纪,集成电路的发展受到摩尔定律的限制,硬件计算力的提升远远满足不了人们对计算力的需求。
手和手腕在人们日常的工作、学习和生活中起着至关重要的作用,人类大部分活动都离不开手的参与。因此,研制一款轻巧、灵活、便捷的假肢手/腕系统将会给上肢残疾人士的生活带来巨大的便利。一些欧美国家早在20世纪中叶便开始对假肢进行研究,我国在这方面起步较晚,技术相对落后,因此研制一款先进的仿人智能假肢手/腕系统对于提升我国假肢的研发能力显得格外重要。本文根据HIT-VI假肢手和手腕的机械结构与功能需求,设计
随着深度学习技术的进步,深度神经网络在诸多领域大量应用,其可解释性问题日益受到人们的广泛重视。目前深度识别网络缺乏数学理论支撑,存在机理不明确的问题,难以对目标识别的风险性、可靠性、适应性、鲁棒性进行准确评估,从而限制了模型的实际部署与应用。因此展开对深度识别网络的可解释性方法的研究迫在眉睫。为此本文在深入研究可解释性包含的内容的基础上,从基于可视化、基于局部近似、基于黑盒测试这三个方法层面对深度
燃烧过程中高温火焰的温度分布不仅能直接表征火焰的三维结构,还可以作为先验知识对燃烧过程的进行预判,具有深刻的指导意义。火焰层析成像技术以其易于实现和非侵入性等优点,在燃烧监测和诊断中发挥着重要作用。然而,由于传统迭代方法的数据量大、耗时较长。因此,本文建立了一种基于深度学习的火焰三维温度快速层析重建和预测的模型,训练后具有快速重建和预测的能力。建立并验证了基于视在光线法的辐射传输模型,建立了考虑辐
光作为一种承载目标信息的载体在很多方面都有很重要的应用,在日常生活中,错综复杂的环境会影响我们对目标信息的获取和判断。本课题对现有的多种从不规则散射光场中获取信息的技术进行分析及研究之后,为了解决现有的散射介质后目标分类方法适应性和鲁棒性差这一缺点,最终选择散斑自相关方法来处理散斑并获得隐藏在散射介质后的目标物体信息,为了解决传统特征提取和分类算法效率低这一问题,选择利用卷积神经网络对处理后的散斑
冲压发动机自发明以来被世界各国广泛运用到超声速领域,具有比冲高、结构简单,经济性高等优点。冲压发动机在世界各国的国防军事领域都有着举足轻重的地位,尤其是欧美等军事强国一直在致力于开展冲压发动机的技术研究。随着冲压发动机工作范围拓宽、飞行距离更远等需求发生改变,仅考虑燃油可调单一变量控制的冲压发动机已经无法适应新环境和新的作战需求。本文针对固定几何结构冲压发动机面临的问题,考虑引入进排气可调的结构,
同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)是机器人领域的重要研究问题,实现了机器人搭载相机和激光雷达等传感器在未知环境中对自身定位同时构建地图的任务。近年来,随着增强现实和自动驾驶等应用的兴起,视觉SLAM(Visual SLAM)研究受到了广泛的关注。VSLAM以图像作为主要感知信息源,通过多视图几何理论估计相机位姿和构建3D场景。
在医学诊断中计算机断层扫描技术(CT)是一种重要的技术手段,但是如果病人的身体中含有金属物质例如人造髋关节,脊柱植入物等,会导致扫描到的CT图像中产生明暗相间的金属伪影,掩盖人体器官组织,从而影响医生对于病情的判断。因此研究CT图像中的金属伪影去除算法具有重要的实际意义。因为传统去除金属伪影的算法在临床应用中效果并不好,要么计算时间较长,要么伪影去除不彻底。而近年来,在计算机视觉领域中,深度学习逐
随着信息技术水平的提升和现代工业的飞速发展,机械设备逐渐朝着集成化、电气化和自动化的发展方向迈进,其设备结构也越来越精细化和复杂化。机械旋转部件作为机械设备中的关键部件,一旦发生故障将会导致整个设备无法运转,轻则增加停机时间,重则引起大量经济损失甚至人员伤亡。因此,对其开展状态检测和故障诊断技术研究,可以维护机械设备的工业生产安全,具有重要的应用价值和潜在的经济效益。目前,机械旋转部件故障诊断工作
主动跟踪系统能够主动地、有目的地调整相机参数实现目标跟踪,在大范围智能监控、大尺度移动目标跟踪领域应用广泛,如何获得目标参数,在具体应用场景中实现优化控制仍是一大难点。利用科技手段辅助体育训练正成为我国体育科研工作的热点和趋势,尤其冬季体育项目,亟需发挥科技力量提升训练质量,实现跨越式发展。短道速滑是典型的滑行技术与比赛战术高度结合的竞技项目,对训练或比赛全过程视频记录是进行训练质量评估和比赛策略