论文部分内容阅读
高光谱遥感技术将成像技术与光谱技术有机地结合在一起,其获取的数据同时涵盖了地物的空间信息与光谱信息,因此可以将高光谱遥感数据看作由光谱维和空间维组成的三维立方体。一方面,光谱维的精细划分可以获取更多的波段,但也导致波段间具有较强的相关性,造成光谱维的冗余。光谱维大量冗余波段的存在不利于数据的存储、传输,且容易引起维度灾难现象,造成地物的分类识别率下降;另一方面,空间维存在大量地物训练样本时,虽然这些训练样本可以为未知样本的预测分析带来更多可能,但也导致训练模型更复杂、低效。而数据去冗余即可解决以上问题,其中光谱维的冗余可以通过波段选择去除,空间维的冗余可以通过样本筛选去除。波段选择是从高光谱数据所有波段中选择起主要作用的波段子集,不仅可以去除光谱维的冗余,而且能较完整地保留有用信息。不同于波段选择方法,样本筛选是从高光谱数据所有训练样本中选择对模型训练贡献度高的样本子集,在不影响模型泛化能力的同时,可以有效去除冗余信息。因此,本文在总结前人研究成果的基础上对高光谱数据波段选择与样本筛选做了进一步的研究,主要研究内容如下:
首先,为提高次优搜索算法的波段搜索效率提出两种在子空间下进行的波段选择方法:1)基于波段子空间的快速搜索方法。该方法在波段子空间下进行,利用波段子空间收窄各波段搜索范围,依次选择各子空间中方差最大的波段作为初始波段,设定目标函数,然后逐子空间替换波段使得目标性能更加优化,直至没有波段可以使得目标更优。该方法只需输入待选波段子集大小,而无需设置其他参数,与经典的波段选择方法相比可以在保证搜索目标质量的同时更快收敛;2)基于人工蜂群算法的波段选择方法。该方法综合考虑了重要信息的保留与冗余信息的去除两方面,将JM(Jeffreys-Matusita)距离与最佳指数的加权和作为目标函数。同时为快速求解组合优化问题,将波段子空间作为波段组合的搜索范围,同时引入对目标函数几乎没有要求的人工蜂群算法(Artificial Bee Colony algorithm,ABC)作为搜索算法。将提出的算法与典型的智能波段搜索方法进行实验比较,结果表明该方法是一种搜索效率和精解能力都比较好的波段选择方法。
然后,为获取兼顾信息量与相关性的波段组合,提出两种基于波段间距离计算的方法:1)基于距离加权的波段选择方法。该方法用标准差衡量波段的信息量大小,迭代计算波段间的JM距离与已选波段的标准差的乘积,选择当前乘积最大的波段进入波段子集,在每次迭代中剔除与该次获选波段距离相近的几个波段,获取可分性与信息量相互支撑的波段子集;2)基于最大最小距离的波段选择方法。首先根据高光谱数据在波段空间的分布呈凸几何结构这一特性,以欧氏距离作为波段间的距离标准计算各波段与已选波段的最大最小距离,顺次选取在高维空间相距尽可能远的波段。然后根据高光谱数据邻近波段具有聚集特性,以最大最小距离方法选择的波段子集为初始聚类中心,通过K中心点算法对全波段进行聚类,同样以欧氏距离为计算标准,择近归类,直至收敛,最后得到的聚类中心就为最终输出波段子集。将提出的两种算法与典型的波段选择方法进行对比,结果表明本章提出的两种方法选择的波段在分类精度方面更理想,生成的波段组合也更稳定,更加能够满足实际需求。
最后,为降低训练模型的复杂度、提高分类效率,针对最小二乘支持向量机以全部训练样本参与模型训练的缺陷,提出一种基于库仑力的样本筛选方法,将物理学中带电粒子间的引力模型引入到训练样本空间位置关系的计算中,通过计算样本点对分类超平面的贡献值,判断样本的去留。通过与FRLS(Fast Reduction for Large Scale)及未经过样本筛选的情形做比较,所提方法可以在保证分类精度最好的情况下,有效提高分类器效率。
首先,为提高次优搜索算法的波段搜索效率提出两种在子空间下进行的波段选择方法:1)基于波段子空间的快速搜索方法。该方法在波段子空间下进行,利用波段子空间收窄各波段搜索范围,依次选择各子空间中方差最大的波段作为初始波段,设定目标函数,然后逐子空间替换波段使得目标性能更加优化,直至没有波段可以使得目标更优。该方法只需输入待选波段子集大小,而无需设置其他参数,与经典的波段选择方法相比可以在保证搜索目标质量的同时更快收敛;2)基于人工蜂群算法的波段选择方法。该方法综合考虑了重要信息的保留与冗余信息的去除两方面,将JM(Jeffreys-Matusita)距离与最佳指数的加权和作为目标函数。同时为快速求解组合优化问题,将波段子空间作为波段组合的搜索范围,同时引入对目标函数几乎没有要求的人工蜂群算法(Artificial Bee Colony algorithm,ABC)作为搜索算法。将提出的算法与典型的智能波段搜索方法进行实验比较,结果表明该方法是一种搜索效率和精解能力都比较好的波段选择方法。
然后,为获取兼顾信息量与相关性的波段组合,提出两种基于波段间距离计算的方法:1)基于距离加权的波段选择方法。该方法用标准差衡量波段的信息量大小,迭代计算波段间的JM距离与已选波段的标准差的乘积,选择当前乘积最大的波段进入波段子集,在每次迭代中剔除与该次获选波段距离相近的几个波段,获取可分性与信息量相互支撑的波段子集;2)基于最大最小距离的波段选择方法。首先根据高光谱数据在波段空间的分布呈凸几何结构这一特性,以欧氏距离作为波段间的距离标准计算各波段与已选波段的最大最小距离,顺次选取在高维空间相距尽可能远的波段。然后根据高光谱数据邻近波段具有聚集特性,以最大最小距离方法选择的波段子集为初始聚类中心,通过K中心点算法对全波段进行聚类,同样以欧氏距离为计算标准,择近归类,直至收敛,最后得到的聚类中心就为最终输出波段子集。将提出的两种算法与典型的波段选择方法进行对比,结果表明本章提出的两种方法选择的波段在分类精度方面更理想,生成的波段组合也更稳定,更加能够满足实际需求。
最后,为降低训练模型的复杂度、提高分类效率,针对最小二乘支持向量机以全部训练样本参与模型训练的缺陷,提出一种基于库仑力的样本筛选方法,将物理学中带电粒子间的引力模型引入到训练样本空间位置关系的计算中,通过计算样本点对分类超平面的贡献值,判断样本的去留。通过与FRLS(Fast Reduction for Large Scale)及未经过样本筛选的情形做比较,所提方法可以在保证分类精度最好的情况下,有效提高分类器效率。