论文部分内容阅读
我国是世界上重要的水果生产大国,水果生长环境的复杂性使得当前水果采摘、加工作业依然依靠人工。然而,随着城市化发展,劳动力成本上升、农业从业人员大幅下降使得水果产业面临劳动力短缺的现实。水果采摘机器人能够提高生产效率,解决当下问题。而水果图像识别是水果采摘机器人视觉识别系统的重要组成部分。近几年兴起的深度卷积神经网络,对目标特征表达能力更强、识别效果更好。利用卷积神经网络对水果图像进行识别,能够为水果采摘机器人的研发设计提供有力技术支持。本文主要研究基于深度卷积神经网络的水果图像识别算法。首先,为了解决目前水果图像识别方法准确率较低、识别种类较少的问题,结合识别任务需求,提出了一种基于改进Darknet-53网络的水果图像分类方法。在该方法中,分析了卷积神经网络中常用的归一化方法,最终使用群组归一化替换原网络结构中的批量归一化,构建Darknet-53-GN网络。同时,构建了包含22种类别的水果分类数据集。在自建的数据集上进行测试,结果表明该方法不受批量大小影响,取得了 95.6%的分类准确率。其次,设计了一种针对自然环境下水果果实目标检测的神经网络模型。以YOLOv3目标检测方法为基础进行了2点改进:采用了基于GIoU的边框回归损失函数;并在原网络的预测层引入残差网络跳跃连接的思想进行连接。使用训练好的Darknet-53-GN分类网络进行权重初始化水果目标检测网络模型,然后用自建带标注的5类水果数据集对网络模型进行训练测试;平均精度为90.85%,且对于不同自然环境影响下的果实目标识别具有良好的鲁棒性。最后,针对便携式移动设备应用场景,设计了轻量化的水果图像目标检测模型。对YOLOv3网络进行模型压缩优化,将轻量级神经网络MobileNetV3-Large作为YOLOv3的主干网络,并继续采用基于GIoU的边框回归损失函数。该模型占用内存为32M,有效压缩模型大小至原来的七分之一,单张图片的推断速度为36.85ms,在保证一定识别准确率的前提下,明显提升了检测速度,增大了模型的可用性。