论文部分内容阅读
目前普遍采用的分类器通常都是针对单一或小量任务而设计的,在小数据量的处理中能取得比较满意的结果。但对于海量遥感数据的处理,其在处理时效和分类精度方面还有待研究。本文以遥感图像场景分类任务为例,着重对遥感数据分类问题中几种典型分类方法的适用性进行比较研究,包括K近邻(KNN)、随机森林(RF),支持向量机(SVM)和稀疏表达分类器(SRC)等。分别从参数敏感性,训练样本数据量,待分类样本数据量和样本特征维数对分类器性能的影响等几个方面进行比较分析。实验结果表明:(1)KNN,RF和L0-SRC方法相比RBF-SVM,Linear-SVM和L1-SRC,受参数影响的程度更弱;(2)待分类样本固定的情况下,随着训练样本数目的增加,SRC类型分类方法的分类性能最佳,SVM类型方法次之,然后是RF和KNN,在总体分类时间上呈现出L0-SRC>L1-SRC>RF>RBF-SVM/Linear-SVM>KNN/L0-SRC-Batch的趋势;(3)训练样本固定的情况下,所有分类方法的分类精度几乎都不受待分类样本数目变化的影响,RBF-SVM方法性能最佳,其次是L1-SRC,然后是Linear-SVM,最后是RF和L0-SRC/L0-SRC-Batch,在总体分类时间上,L1-SRC和L0-SRC相比其他分类方法最为耗时;(4)样本特征维数的变化不仅影响分类器的运行效率,同时也影响其分类精度,其中SRC和KNN分类器器无需较高的特征维数即可获得较好的分类结果,SVM对高维特征具有较强的包容性和学习能力,RF分类器对特征维数增加则表现得并不敏感,特征维数的增加并不能对其分类精度的提升带来更多的贡献。总的来说,在大数据量的遥感数据分类任务中,现有分类方法具有良好的适用性,但是对于分类器的选择应当基于各自的特点和优势,结合实际应用的特点进行权衡和选择,选择参数敏感性较小,分类总体时间消耗低但分类精度相对较高的分类方法。