论文部分内容阅读
植物识别是从给定图像中自动识别出植物的名称。现有的大多数关于自动植物识别研究,集中于利用植物的单一器官进行植物种类识别,例如,使用花、叶或果实,或者使用单张图像识别植物。使用植物的单个器官识别植物并不可靠,因为许多不同的植物却有着极其相似的器官。对于野外直接采集的图片,通常都有着复杂的背景,所以使用单张图片很难从图片中剥离出植物最有区分能力的特征。为了克服植物图像识别准确率不高的问题,本文研究了基于图像集的植物种类识别方法,并提出了基于深度卷积神经网络的多线索植物种类识别方法。本文的主要研究内容和结论如下:(1)改进了两种基于图像集的算法并将其应用于植物识别。改进了两种经典的图像集算法,基于成对线性回归图像集分类和基于原型判别学习的图像集分类,仔细介绍了改进后的基于图像集算法的思想、算法原理和算法流程图,并将其应用于植物识别,结合植物图像集训练植物识别模型。由于植物图片的背景复杂且与待识别植物及其相似,为了更好凸显植物特征,对植物图像采用了数据增强技术来扩充图片数量。且最后两种改进后的基于图像集的植物识别模型的识别准确率为62.01%和64.22%。(2)改进了GoogLeNet的网络结构并将其应用于植物识别。提出了NewInception模块结构,并采用新的激活函数h-Swish替代传统的激活函数ReLU。在PlantCLEF2016数据集中挑选了12类植物,利用该数据训练基于改进后的GoogLeNet的单器官模型。通过对ImageNet迁移学习,并调整改进后GoogLeNet最后的全连接层神经元个数为12个,训练最优的花、果、叶和整株的单器官分类器。最后花、果、叶和整株的单分类器模型的识别准确率为82.74%,86.23%,63.25%,65.06%。(3)提出了基于改进后GoogLeNet网络的多线索植物种类识别方法。根据各个单分类器预测的标签和得分进行多器官融合识别,每个单分类器根据其识别的平均准确率具有不同的权值,植物的最终预测类别由单分类器的预测标签、单分类器给出的预测分数以及单分类器本身的权值共同决定。本文提出的多线索模型在PlantCLEF2016数据集中,对12类植物的识别准确率为92.33%。实验结果表明,基于传统的图像集识别方法在识别具有复杂背景的植物图像时,识别准确率不高,要达到更高的准确率则需要更精细的预处理工作。基于深度卷积神经网络的多线索模型的识别准确率明显高于基于图像集的植物种类识别方法。