论文部分内容阅读
随着遥感数据获取技术的快速发展,数据源的多样性远远超前于数据的处理水平。因此,关于遥感数据处理与分析方法的研究对推动遥感数据应用具有重要的意义。其中,多光谱遥感数据的分类就是一个具有挑战性的研究方向之一。支持向量机(Support Vector Machine, SVM),作为统计学习理论最有效的方法之一,克服了传统方法中的过学习、非线性、维数灾难以及局部极小等问题,成为了多光谱遥感影像分类算法中的一个研究热点。SVM是一种机器学习算法,用于多光谱遥感影像的分类已经有二十年的历史。k-means聚类算法作为一种经典的聚类算法,也被用于对各种数据进行分类。通过阅读大量的文章发现,这两种算法均具有各自独特的优势与不足。因此,为了满足多光谱遥感影像分类后的应用需求,这两种算法的分类性能都具有一定的提升空间。由于SVM算法属于监督分类方法,分类前需要人工选取(标注)的训练样本来建立分类模型。然而,k-means聚类算法属于非监督分类方法,无需训练样本就可以自动对未知样本进行聚类。因此,这两种分类算法,在原理上具有很大的互补性。为进一步提高分类精度,本文提出了一种SVM与k-means联合工作的多光谱遥感影像混合分类模型。本文完成了该模型的数学推导,并将此策略成功地应用到了Landsat TM多光谱遥感影像数据的分类中。该混合模型的工作原理是:首先采用k-means对未知数据进行聚类,然后从各类的聚类中心周围一定半径内自动选取训练样本,作为SVM的训练数据。实验表明,通过人工标注的样本建立的SVM模型的分类精度为89.47%,而混合分类模型分类精度为97.53%。显然,混合模型的分类精度得到了显著的提高,从而有力地证明了该方法的有效性。在课题研究过程中,详细分析了“混合模型”所涉及到的一系列理论与实践问题。包括:高维数据与低维数据对不同核函数(Kernel)的适应问题、SVM的参数寻优算法(三种优化算法)的选取问题、SVM变形算法(C-SVM、v-SVM及LS-SVM)的分类性能、二次规划问题的求解等。此外,本文还重点研究了核参数γ及惩罚因子C对RBF核函数下SVM分类器性能的影响。围绕本课题的目标,本文进行了五个方面的研究,采用了十六个实验来验证本文所涉及的一系列理论问题。通过对实验的结果分析,获取了重要的实验数据和结论,极大地丰富了理论研究的内容。这些研究内容为进一步的理论研究提供了有力的支撑,为本文提出的“SVM与K-means多光谱遥感影像混合模型分类模型”奠定了不可或缺的基础。