论文部分内容阅读
植物在大自然中扮演着重要角色,大自然的有序循环、人们日常生产生活都离不开植物。全球植物种类繁多,数量巨大,特别是在我们国家,植物种类丰富多样,分布广泛,那么如何能快速有效的识别植物种类呢?由于植物种类繁多,单纯靠人工识别,效率较低,所以自动化的识别工作显得尤为重要。而不同的植物叶片在形状、颜色和叶脉纹理上都有很大差距,从而我们可以利用植物叶片的外观视觉特征来辨别不同的种类。随着当前数字计算机处理技术和人工智能技术的快速发展,植物的外观视觉特征提取也并不依靠人工,计算机技术以及编程软件在此类领域发挥着重要作用,不仅可以节约人力物力的投入,而且可以有效的提高图像识别的准确率。本论文是基于UCI公开数据库中的植物叶片数据集,从该数据集中挑选了24类植物,共计281张,平均每类约有12张图片,每张图片对应14个特征。论文中使用了两大类方法,第一类方法是基于所有植物的叶片特征进行分类识别,第二类方法是直接对281张图片,采用卷积神经网络进行训练和识别,具体如下:第一类是机器学习中的传统方法,包括决策树、支持向量机、随机森林。机器学习中的传统方法是基于植物叶片的外部特征进行分类,进行分类的结果为:第一种:决策树,植物叶片的识别率为:64.41%;第二种:随机森林,植物叶片的识别率为:78.29%;第三种:支持向量机,植物叶片的识别率为:89.32%。并进行了十折交叉验证,十折交叉验证值越来越小,误差值也越来越小,由此可知在机器学习传统方法中,支持向量机有较好的效果。第二类方法是使用了深度学习中的卷积神经网络,卷积神经网络在图像信息识别准确率高,无需人工定义植物叶片纹理特征减少繁琐的人工成本,本论文网络搭建和训练的过程是基于Keras深度学习框架,将图片库的叶片图片归一化为299×299统一大小,最终识别率为83.67%。为了提升识别率,本文对原始图片进行了进一步的预处理及扩充,首先对图片库的数据集进行批量预处理,再对原始图片进行方向、灰度等的扩充。最终将281张图片扩充2880张图片。再将2880张图片分为9:1,其中9份作为训练集,剩余的1份图片用训练测试集,经过网络的训练,植物叶片识别率达到95.14%。从实验中可以得出,卷积神经网络在无论是精度方面还是效率方面都要优于机器学习传统方法。可见,卷积神经网络在植物叶片的识别方面具有很好的应用前景。