论文部分内容阅读
我国农业生产长期以来依靠人工,导致劳动强度大但效率低。随着计算机和自动控制技术的迅猛发展,农业生产的自动化和智能化水平得到了较大提高。其中,机器视觉技术具有识别精度高,信息丰富,无损检测等特点,为果园采摘机器人的视觉定位提供了技术支持。在机器人采摘过程中,近色背景中果实的视觉精确识别一直是研究的难点,因此进行自然环境中绿色水果的视觉识别有重要意义,对农业的自动化和智能化生产具有十分重要的社会效益及经济效益。本论文主要进行了近色背景中的果实检测技术的研究,以绿色柑橘为对象,进行了传统的图像分割算法和深度学习算法的对比分析。通过多组实验进行识别算法的设计与参数优化,同时对两种算法的优劣性与适用范围进行讨论。在传统的图像分割算法上,本论文选择了阈值分割算法进行目标检测。阈值分割流程大致可以分为预处理、分割和后处理等三个阶段。在预处理阶段主要对图像颜色特征进行分析,确定了在Cb分量图像中,果实和背景的对比度较大,可用于后续的分割操作;在分割阶段主要对比了几种不同的增强算法对图像对比度的增强效果,确定了使用Retinex算法增强图像,同时使用最大类间方差法来选择合适的分割阈值;在后处理阶段主要是对二值分割图像做进一步的形态学处理,实现对目标的定位检测。在深度学习算法上,本论文选择了Faster RCNN进行目标检测。实验准备主要为配置实验环境、制作实验数据集以及人工标注文件、选择预训练模型和损失函数;调参训练主要是对学习速率、批处理大小和动量等超参数进行对比实验,确定合适的学习速率为0.01、批处理大小为128、动量为0.9,使用确定的超参数对模型进行训练;最终模型在测试集上得到的检测平均精度为83.24%。最后通过设计多个对比实验来评价两种算法的优劣,对比实验主要研究两种算法对不同图像的检测效果,试验选择的图像包括不同果实个数的图像、不同面积尺度的果实图像以及不同光照角度的果实图像。根据对比结果进行适用性分析,得到的结论为:阈值分割算法适用于采摘机器人的定位检测作业,而Faster RCNN则适用于对多果实目标及小面积尺度的果实目标的检测作业,其实验结果为基于机器视觉的产量估计的可行性提供了依据。