论文部分内容阅读
近年来,随着高光谱遥感技术的发展,其应用已经覆盖环境监测,医疗图像,精准农业,城市监测等方面。与此同时,高维度的光谱结构也为高光谱图像处理带来了新的挑战。邻近波段之间往往存在大量的冗余信息,高维度的数据结构往往会导致“Hughes”现象,并且会增加存储空间与算法计算复杂度上的负担。另外,在高光谱数据中带标签的数据很少并且标签信息的获取难度很大。本文结合高光谱的数据特点,做了深入的研究分析,并提出了多种无监督的特征选择与特征提取方法,概括如下:(1)针对无监督的波段选择问题,综合考虑了重要信息的保留与冗余信息的去除两方面,将这两方面同时设计进一个目标函数中。由于该目标函数的解空间是离散的,不易于获得导数信息,本质上是一个组合优化问题。因此我们又设计了一个基于Memetic计算的启发式随机搜索策略,用于该目标函数的优化。实验结果表明,我们提出的算法比起传统的波段选择方法在后续分类精度上有了明显的提升。(2)针对传统的FCM无监督聚类方法中存在对初始化状态和噪声点敏感,以及易于陷入局部最优的问题,我们设计了一种基于PSO的优化方法来替代传统FCM中基于拉格朗日乘子法的迭代优化,并将该方法应用于高光谱的无监督波段选择中。实验结果证明,我们提出的算法对初始状态和噪声波段有良好的鲁棒性,并且不易于陷入局部最优。另外,在后续的分类实验中,分类精度得到了进一步的提升。(3)无监督特征选择问题中,如何确定特征子集中的特征个数一直是一个具有挑战性的开放式问题。针对这一问题,我们将其建模为一个多目标优化模型,来量化其矛盾关系,即所选特征数目与保存信息量之间的权衡关系。并且设计了一种基于分解的进化多目标优化的启发式随机搜索策略来优化该模型。该方法可以在运行时同时优化多个具有不同特征数目的特征子集的解。实验结果表明,提出的方法可以通过一次运行得到一系列具有不同特征数目的特征子集,为决策者提供更多的选择。并且这些特征子集在后续的分类实验中均有良好的表现。(4)由于高光谱图像中存在一些信息量不大的噪声波段,而这些波段往往与其他波段的像素分布具有明显的不同。这使得高光谱无监督特征选择问题中,重要信息保留与冗余信息的去除两方面在本质上存在着矛盾的关系,其优化方向不一致。而不同的高光谱图像数据往往对这两方面有不同的需求。如何根据不同数据集来确定这两方面的最优权衡关系成为了一个具有挑战性的问题。针对这个问题,我们分别将这两方面量化,设计了两个目标函数,并用他们构建了一个多目标模型。我们利用该多目标模型来探索在不同数据集下这两方面的最优权衡解。另外,为了优化该多目标模型,我们提出了一种基于多目标人工免疫算法的启发式随机搜索策略。实验结果表明,我们提出的算法可以根据不同数据集的数据特点有效探索这两方面,并给出一系列最优权衡解集为决策者提供更多的选择。分类实验结果表明,我们提出的算法得到的波段子集在分类表现上有明显的提高。(5)深度学习网络结构中的超参数需要大量的具有标签的样本来训练,而高光谱图像中具有标签信息的数据很少。因此,如何在保证其性能不降低过多的情况下减少深度学习在高光谱特征提取方面对于标签信息的需求量是一个挑战性问题。针对这一问题,我们提出了联合WGAN与CNN的方法。在该方法中,利用了 CNN对空间信息与光谱信息强大的特征提取能力,并且针对CNN网络训练的问题采用了 WGAN的框架设计了一种无监督的训练方式。该方法在特征提取环节是完全无监督的,摆脱了对标签信息的依赖。我们在三个真实数据集上进行了分类实验,实验结果证明,提出的算法比传统的无监督特征提取算法在分类精度上有了明显的提升,验证了算法的有效性。