论文部分内容阅读
植物是地球上物种数量最多、分布最广泛的生命形式,影响着人类赖以生存的生态系统,是人类生存与发展和生活必需的重要资源。同时,植物与农业有着密切的联系,而农业作为国民经济的命脉,是一个国家赖以生存的基础。因此,开展植物物种的机器识别研究具有重要的现实意义。传统的识别方法,大多是依靠专业人员自身丰富的经验,利用植物外部形态上的特征,去识别植物的种类。这些方法很难被非专业人员掌握,也很难应用于日常生活。而地球上大约有40多万种植物,依靠人为的记忆和经验很难有效地识别。本文以北京地区的杨树为研究对象,通过数码相机及扫描仪采集杨树叶片和树皮的图像,交由计算机自动分析杨树叶片和树皮的形状特征和纹理特征,采用图像处理和识别等技术,对北京地区的杨树种类进行自动识别的研究。论文深入探讨了基于图像分析的植物种类自动识别技术,采用了叶片图像特征与树皮图像特征相结合的植物种类识别方法,并在分类器方面提出了针对性的改进。论文的主要工作和贡献如下:(1)提出了植物多器官的联合识别的方法。相对于以往大多数研究的只针对植物单一器官作为特征样本,进行特征的选择和提取,本文使用同一植物的多器官作为特征样本,通过分别对叶片的特征和树皮的特征两种器官结合的特征进行识别。在丰富了样本多样性的同时,也提升了最终的平均识别率。通过实验结果可以看出,基于北京地区杨树叶片和树皮的多器官识别相较于单器官识别在平均识别率方面有较大的提升,对于提升植物识别工作的识别率提供了新的思路和方法。(2)在特征提取方面,本文通过分析杨树叶片和树皮图像在不同种类间的区别与共性,结合常用数字图像分类特征定义方法,设计了专门用于杨树的特征提取算法。在特征提取结果基础上,根据应用需求和特征优化结果,最终选取了叶片的形状特征(复杂度、偏心度、圆形性、球状性、面积凹凸比、周长凹凸比、纵横比、矩形度、周径比、叶状性)、纹理特征(分形维数、缝隙量、能量、熵、对比度、相关性)和树皮的纹理特征(分形维数、缝隙量、相关性、对比度、能量、熵、局部均匀性)共23个特征构建特征向量,作为识别、鉴定不同杨树种类的依据。(3)提出了一种基于Adaboost分类器和KNN分类器的改进分类器:Adaboost.M2-KNN分类器。针对Adaboost的算法要求每一个弱分类器错误率小于50%,本文引入了Adaboost.M2分类器,M2分类器的优点是通过伪误差来评估弱分类器,对没有正确分组的样本以及没有正确识别的弱分类器进行惩罚,使其拥有更多的训练机会,进一步提高正确率。但是M2分类器在是Pseudoloss规则的基础上进行选择弱分类器的,弱分类器的产生比较复杂,算法的训练时间和识别时间也比较长。基于以上的研究,本文使用KNN分类作为AdaBoost.M2算法的弱分类器,可以大大的减少弱分类器产生的复杂度,降低弱分类器的错分率,同时在以下方面有进一步的提升:1、训练时间和训练次数显著缩减。本算法的平均训练时间为30.8秒,比其他分类器的平均训练时间缩减5秒至290秒不等,训练次数也有大幅度的缩减;2、缩短了平均识别时间。本算法的平均识别时间为0.9秒,比其他分类器的平均识别时间减少0.1秒至19.2秒不等;3、提高了平均识别率。本算法的平均识别率为92.93%,高出其他分类器4%至11%。综合分析,本算法在分类识别的各项性能方面都有较大的提升。