论文部分内容阅读
本文针对经典K-Means算法存在的一些缺陷,结合森林健康评价指标选取的实际情况,对经典K-Means算法进行了一系列的改进,并将改进的K-Means算法作为森林健康评价的方法应用于森林健康评价,这对提高森林健康评价结果的精确度有着很强的理论和现实意义。本文主要的研究内容和研究结论包括:(1)通过分析和对比各种聚类分析算法及其经典K-Means算法的聚类思想及基本流程,总结出经典K-Means算法所具有的优点与缺陷;(2)针对经典K-Means聚类算法的不足,提出了基于维方差排序的K-Means改进算法,同时采用最小距离代价函数确定聚类划分簇数K值,以增加算法在选取初始聚类中心时的合理性,提高聚类结果的准确度;(3)采用国际通用的Iris、Glass、Wine和Ecoli四个数据集作为测试数据集,利用数值模拟对提出的基于维方差排序的K-Means算法进行了检验。结果表明:优化改进后的算法所选取的初始聚类中心十分接近于聚类迭代后最终收敛的聚类中心,并且聚类结果相对于经典K-Means聚类算法更具稳定性。(4)结合研究对象——湖南省大围山自然保护区的实际情况,以科学理论为依据,选取林分郁闭度等13个指标来构建大围山区域的森林健康评价指标体系,并采用基于知识粒度的权重确定方法对各项指标进行权重确定。将改进的基于维方差排序K-Means算法应用到森林健康评价中,获得了比较理想的评价结果,并对评价结果进行了分析,相比传统的健康公式法计算综合值进行评价分析,更具实际意义和应用价值。评价方法的选取是森林健康评价过程中的关键,将会直接影响到最终的评价结果。已有的森林健康评价方法,大多数是采用等距划分思想确定评价标准,通过森林健康评价模型获得评价结果。将基于维方差排序的K-Means算法应用到森林健康评价,增加了评价标准划分的客观性和合理性,也在一定程度上提高了评价结果的准确率。