基于深度卷积神经网络的水果图像识别算法研究

来源 :中央民族大学 | 被引量 : 2次 | 上传用户:klzvms1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国是世界上重要的水果生产大国,水果生长环境的复杂性使得当前水果采摘、加工作业依然依靠人工。然而,随着城市化发展,劳动力成本上升、农业从业人员大幅下降使得水果产业面临劳动力短缺的现实。水果采摘机器人能够提高生产效率,解决当下问题。而水果图像识别是水果采摘机器人视觉识别系统的重要组成部分。近几年兴起的深度卷积神经网络,对目标特征表达能力更强、识别效果更好。利用卷积神经网络对水果图像进行识别,能够为水果采摘机器人的研发设计提供有力技术支持。本文主要研究基于深度卷积神经网络的水果图像识别算法。首先,为了解决目前水果图像识别方法准确率较低、识别种类较少的问题,结合识别任务需求,提出了一种基于改进Darknet-53网络的水果图像分类方法。在该方法中,分析了卷积神经网络中常用的归一化方法,最终使用群组归一化替换原网络结构中的批量归一化,构建Darknet-53-GN网络。同时,构建了包含22种类别的水果分类数据集。在自建的数据集上进行测试,结果表明该方法不受批量大小影响,取得了 95.6%的分类准确率。其次,设计了一种针对自然环境下水果果实目标检测的神经网络模型。以YOLOv3目标检测方法为基础进行了2点改进:采用了基于GIoU的边框回归损失函数;并在原网络的预测层引入残差网络跳跃连接的思想进行连接。使用训练好的Darknet-53-GN分类网络进行权重初始化水果目标检测网络模型,然后用自建带标注的5类水果数据集对网络模型进行训练测试;平均精度为90.85%,且对于不同自然环境影响下的果实目标识别具有良好的鲁棒性。最后,针对便携式移动设备应用场景,设计了轻量化的水果图像目标检测模型。对YOLOv3网络进行模型压缩优化,将轻量级神经网络MobileNetV3-Large作为YOLOv3的主干网络,并继续采用基于GIoU的边框回归损失函数。该模型占用内存为32M,有效压缩模型大小至原来的七分之一,单张图片的推断速度为36.85ms,在保证一定识别准确率的前提下,明显提升了检测速度,增大了模型的可用性。
其他文献
明代中后期,花生由美洲传入中国,逐渐成为重要的经济作物和油料作物。士人是传统农业生产力量的组成部分,往往选择将其劳动实践载诸笔端,这就为探讨花生的栽培技术提供了一些
元认知监测是元认知研究的重要组成部分,近年来成为国内外众多研究者关注的热点。已有大量研究发现元认知监测的准确性对自我调节学习具有重要意义。学习判断(Judgment of Le
越来越多的教育数据随着高校应用系统和硬件设备的汇总不断地产生,如何从这些大数据中挖掘出给各层决策者更加科学、准确的决策信息,给高校信息化建设者带来了重大挑战。学业
自2013年以来,精准扶贫思想成为扶贫攻坚战的核心战略,实施以来在全国范围内取得了优异的成绩。就业,被视为最大的民生工程,因此在精准扶贫中就业扶贫的地位亦不可忽视。就业
运用文艺方法进行社会动员是我们党革命、建设和改革取得成功的重要经验。新时期推进社会主义现代化建设,必须充分发挥文艺方法的社会动员作用,准确把握文艺动员的特征,坚持
国际收支是反映国际间经济往来和交易流量最科学、最完整的记录,国际收支平衡也成为了分析一国国民经济状况的重要环节。一国的国际收支结构会对其利率、汇率、贸易、财政、
重组有资产重组和债务重组两种形式,是指改变了上市公司法律、经济、产业结构的非经常性经营活动。资产重组是企业增加经济市场规模、调整产业结构、实施战略发展规划的重要
采用三本不同规范推荐的方法对西安地区某一高层建筑CFG桩复合地基变形进行了计算,并通过对计算值与实测值的对比分析,探讨了不同计算方法的适用性和沉降计算经验系数的合理
基于我国铁路非运输企业的特点及信息化建设现状,以信息系统集成、信息资源规划等理论为基础,分析铁路非运输企业商务信息共享的行业需求,研究商务信息分类策略及信息共享关