基于深度学习的猕猴桃冠层检测与果实多分类定位方法研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:JGTM2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的猕猴桃果实检测方法未考虑采摘机器人作业需求,均将果实识别为一类,导致枝干和钢丝等遮挡的果实也被识别,这部分果实的采摘有可能损伤末端执行器及机器人,造成巨大经济损失。因此,本文展开了基于深度学习的猕猴桃冠层检测与果实多分类定位方法研究,以期实现猕猴桃采摘机器人更快更精准的检测和定位适合机器人采摘的猕猴桃果实。主要研究内容与结论如下:(1)多分类猕猴桃数据集和冠层图像分割数据集的构建。根据果树生长特性和棚架栽培的特点,采用对果实底部成像的方式全天采集猕猴桃冠层图像。解析确定冠层图像分割数据集和多分类检测数据集的标记对象类别,并进行人工标注。为避免过拟合现象,增加数据集多样化,改善学习过程并提高模型的泛化能力,分别对两种数据集进行数据扩增。最后,将扩增后的数据集分别以相应的格式整理以作为网络的输入数据。(2)基于DeepLabV3 的猕猴桃冠层图像分割与钢丝重建研究。针对猕猴桃冠层图像中背景、果萼、枝干和钢丝类别像素占比不均衡的问题,提出一种适合猕猴桃冠层图像数据集语义分割的均一权重配置方法。为实现DeepLabV3 模型分割精度和速度的均衡,对比了基于四种不同特征提取网络(Xception-65、Xception-71、ResNet-50、ResNet-101)下的模型分割性能,结果表明,基于ResNet-101的DeepLabV3 模型对猕猴桃冠层分割的mIoU为0.694,PA为96.0%,优于其他特征提取网络。最后,对于分割图中离散的钢丝像素,改进基于PPHT算法的钢丝连续化重构方法,完成钢丝的直线拼接,取得92.4%的正确检测率,6.06%的漏检率和1.52%的误检率,在IntelXeonE5-1650v4(3.60GHz)六核CPU上处理一幅512×341分辨率的图像仅需6.40ms,可以实现实时应用。(3)基于YOLOv5s的猕猴桃多分类果实识别研究。针对深度学习方法造成部分不适合机器人采摘的果实过度识别的新问题,综合考虑实验硬件平台条件和模型检测精度,使用基于YOLOv5s模型进行复杂田间环境下多分类猕猴桃果实的识别。针对个别果实同时出现两类检测框的情况,提出一种基于“类别优先级”的方法剔除低级别的检测框。对232幅测试集图像进行试验,结果表明,本文YOLOv5s模型对NO、OB、OW、OL和OF五类果实检测的AP(AveragePrecision)值分别为99.0%、96.1%、94.7%、95.1%和96.4%,mAP(meanAP)值为96.2%,模型权重为14.5MB,平均每幅图像的检测时间为14.8ms。模型对不同光照和曝光环境下的多分类猕猴桃果实的鲁棒性较强。本文提出的两类检测框修正算法,可以有效地将低级别果实检测框剔除。(4)基于小觅双目MYNTEYED1000-50/Color相机的田间猕猴桃果实定位算法研究。为保障猕猴桃采摘机器人田间环境下的安全采摘作业,实现障碍物在不适合机器人采摘处的信息确认,对DeepLabV3 猕猴桃冠层语义分割模型和基于YOLOv5s的多分类猕猴桃检测模型输出结果进行融合。采用张正友标定法标定相机并获取左、右目相机的内参和外参。使用Python编程获取深度图中多分类果实检测框的中心点、枝干和钢丝像素点的深度值,通过坐标转换方法得到相机坐标系下的三维空间坐标。最后设计田间试验验证定位方法的准确性,结果表明,小觅双目MYNTEYED1000-50/Color相机在X轴、Y轴和Z轴平均误差分别为8.4mm、9.3mm和10.4mm。最后,根据田间环境下猕猴桃果实的类别信息、三维空间坐标及枝干和钢丝的三维空间分布,展望了田间环境下猕猴桃果实的安全采摘策略。综上所述,本文针对深度学习造成的枝干和钢丝等遮挡的果实过度识别的问题提出了可行的解决方案,即基于深度学习的冠层检测与果实多分类定位方法。其中,基于YOLOv5s的多分类猕猴桃检测模型平均检测精度高、速度快、模型更小,可以实现对不同光照和曝光环境下的多分类猕猴桃果实的检测。该研究为实现猕猴桃采摘机器人更快更精准的检测和定位适合机器人采摘的猕猴桃果实提供新思路,探索新途径,从而进一步推进猕猴桃产业化、智能化、安全自动化。
其他文献
~~
期刊
本文从PLC技术基础概述入手,介绍了该技术的运转原理,分析了PLC技术应用于电气工程及其自动化中的优势,分别从信息数据采集与控制、闭环控制、顺序控制三个方面入手,总结了PLC技术在电气工程与自动化系统中的应用,以期为电气工程的自动化控制技术发展提供参考。1PLC技术简述1.1PLC技术PLC技术的实现是依靠程序的编写、顺序的控制以及算法的应用,
Hopfield神经网络在模式识别、联想记忆、并行运算和解决困难的最优化问题上有着广泛的应用,而在这些应用中,Hopfield神经网络动力学性质有着重要作用,因此Hopfield神经网络的动力学行为特别是稳定性问题受到了广泛的研究.本论文主要讨论了多比例时滞Hopfield神经网络、变时滞脉冲Hopfield神经网络及高阶脉冲常时滞Hopfield神经网络的稳定性.
α-葡萄糖苷酶和α-淀粉酶是血糖生成过程中的关键酶,其抑制剂是一种以延缓肠道碳水化合物吸收而治疗糖尿病的口服降糖药物,目前市场上常用的α-葡萄糖苷酶和α-淀粉酶的抑制剂如阿卡波糖等对人体有一定的副作用。因此,筛选高效低毒的天然α-葡萄糖苷酶和α-淀粉酶的抑制剂具有重要的价值。存在于果蔬中的酚类化合物即为一类常见的天然的α-淀粉酶和α-葡萄糖苷酶抑制剂。秋葵是一种血糖
作为宣武医院影像医学带头人,卢洁带领团队以临床问题、患者需求为导向,致力于通过技术改进、科研创新,推动临床医学及技术整体进步。随着大数据、人工智能的迅速发展,由影像牵动的医疗模式变革正如火如荼。然而,在首都医科大学宣武医院(以下简称宣武医院)副院长、放射与核医学科主任卢洁的职业生涯中,由她与团队主导的类似革新早已成为一种常态。
降水潜热是驱动区域和全球大气环流的主要能量来源,准确把握潜热垂直结构是正确理解Walker环流、厄尔尼诺南方涛动(ElNinoandSouthernOscillation,简称ENSO)、季风、热带太平洋30-60天低频震荡(Madden-Juianoscillation,简称MJO)、台风和锋面等不同尺度大气现象的前提。然而,现有的卫星潜热反演产品大多以查表法为主
【目的】分析云南省大理苍山东西坡植被的垂直分布格局变化特征,为有效保护苍山生态环境和物种多样性提供参考依据。【方法】以大理苍山为研究区域,基于高分二号(GF-2)高分辨率遥感影像,结合大理苍山完整的山地植被垂直地带性分布规律,辅以纹理特征和数字高程模型(DEM)数据,采用面向对象的多层次图像分割法,通过构建地形约束因子参与分类过程,准确选择样本,高精度提取研究区域的
?学校代码:10134M号IG4教育硕士学位论文新课标背景下初高中数学教学的衔接研究RESEARCHONTHECONNECTIONOFMIDDLESCHOOLANDHIG?
学位
硕士学位论文MASTER’SDISSERTATION西北大学学位评定委员会二○二一年六月分类号:G210学校代码:10697密级:公开学号:201820300疫情语境下健康类自媒体辟谣研究--以“丁香医生”微信公众号为例学科名称:新闻学作者:王楚指导老师:高春艳
学位
绘画是色彩的艺术,它借助色彩的规律特点,从而体现出独特的艺术美。唐代敦煌壁画以它独特的色彩,渲染视觉,引起共鸣。在当时取得了相当非凡的成就,其色彩比绢本、纸本更加的完整,其研究更具有价值性。人物绘画如果使用其色彩,既能展现敦煌壁画的色彩美,也能展现人物绘画的视觉和艺术美,展现一种新的生命力的延伸。因此,敦煌壁画的研究,不仅点缀了中国绘画艺术的色彩,也点亮了世界绘画艺