基于深度学习算法的水果图像目标分类与检测研究

来源 :南华大学 | 被引量 : 3次 | 上传用户:fisher58
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
改革开放以来,我国水果种植面积不断扩大,水果产量不断提升,然而,过去大部分的水果采摘作业基本依靠人工,而从事农业生产的人员又在不断缩减,为应对农业生产中人力不足的必然发展趋势,开发具有识别与定位功能的采摘机器人符合社会发展需要,将给社会发展带来巨大的经济效益和广阔的市场前景。近年来,随着深度学习的迅速发展和崛起,尤其其在视觉方向取得了巨大的成就,相比传统的识别算法,深度学习在对目标识别的特征描述上能力更强。因此,开发基于深度学习算法视觉识别功能的采摘机器人具有重大意义。首先,本文基于当前先进的深度学习算法进行实验探究,提出了基于卷积神经网络的水果图像分类识别算法,主要参照经典的卷积神经网络模型LeNet-5结构,提出新的卷积神经网络结构并对苹果、梨、橙子、橘子、桃子五种水果进行分类识别,该模型构建了一个输入层、两个卷积层、两个池化层、两个全连接层和一个输出层。实验结果表明,所提出的卷积神经网络结构不仅在数据集上取得了96.88%的识别准确率,相比原始的LeNet-5模型获得的准确率更高,收敛速度更快。其次,本文对水果图像识别又进行了更为深入的研究,基于深度学习目标检测算法,为论证算法的可行性,选取苹果图像作为具体的研究对象,而当前主流的深度学习目标检测算法有Faster-RCNN、YOLO、SSD,本文的检测算法采用基于区域建议的Faster-RCNN,通过该算法来对图像中的苹果进行识别与定位研究。为应对自然场景下苹果目标可能出现的遮挡、重叠、逆光、表面光照不均等情况,在采集图像时,拍摄了包含不同尺寸大小、数量以及不同光照角度的苹果图像,通过选取本文提出的改进的LeNet-5和经典的卷积神经网络VGG16以及ResNet101为基础提取网络并进行建模对比,探讨不同框架模型下的检测效果,通过多次设定不同的超参数组合并进行模型的精度对比,以此来得到了合适的超参数组合,最终在基于ResNet101的Faster-RCNN苹果检测模型上得到了90.91%的平均检测精度,而在以本文提出的改进LeNet-5模型上获得的检测精度太低,又相比以VGG16为基础提取网络的模型,基于ResNet101的模型在平均检测精度上得到了明显的提升,虽然在检测速度上逊色于VGG16,检测一幅图像的时间为0.39秒,但已经达到了实时性的要求,并且得到了98.96%的查全率和85.74%的召回率,通过最后的实验测试表明,该模型可用于对树上苹果的检测,验证了算法的可行性,也为研究检测其他种类的水果提供了经验。
其他文献
分析了传统电网调度自动化系统的结构 ,提出了一种遵循 IEC61 970标准的新一代系统的体系结构。从横向看 ,该结构是基于公用对象请求代理机制的分布式集成框架 ;从纵向看 ,该
《桐城文学渊源考》兼具“学案”、“目录”、“索引”之作用,是研究桐城文派最佳工具之一。作者刘声木,为光绪年间庐江名士,虽出身官宦世家,却不慕仕途,一生埋头书斋,藏书著
大数据新闻以数据挖掘与分析为思维基点,带来了新闻生产的创新驱动,也启发和拓展了媒介功能的广度和深度,帮助传媒机构更好地整合、利用数据资源。本文立足大数据的"关联关系
并行测试生成原型系统PATGTA基于串行ASIC测试生成和可测性分析系统ATGTA, 采用PVM作为并行支撑环境,可方便地移植于各种并行计算环境,采用主从模式开发并集成了多种并行算法
讨论了目前常用的几种国家坐标与地方坐标的转换方法,并对它们的效果进行了比较分析,得出了一些有益结论。
高校学生思想政治教育的有效性受到了来自社会、高校和学生自身等因素的影响和制约,应通过营造大学生健康成长的良好社会环境,健全机制,发挥高校优势丰富大学生思想政治教育
中国经济发展进入新常态,是十八大以来党中央对我国现阶段经济发展特征和未来一段时期经济发展趋势作出的重大战略判断。当前,中国既面临全面建成小康的紧迫历史任务,同时也
目的:探索品管圈质量改进方法在降低气管切开患者中、重度粘痰发生率中的作用。方法:2013年2月至12月,用QC的方法以"降低气管切开患者中、重度粘痰的发生率"为主题,开展品管圈活
本文给出了多数据库事务处理原型系统MDBS-1的设计方案,并着重讨论了事务处理核心和局部代理的设计与实现。利用多线索技术来提高事务间的和事务内的并行性,以提高系统的性能。
1.引言党的十八大以来,以习近平同志为核心的党中央,将军民融合深度发展上升为国家战略,并纳入“四个全面”战略布局,作为国防和军队改革的三大任务之一强力推进,明确提出要