论文部分内容阅读
高光谱图像分类是高光谱图像处理技术的重要组成部分。通过计算机等设备来对高光谱图像中属于不同地物特有的空谱信息进行分析,并采取有效的分类手段将所有像元划分各自独立、相互不重叠的区域中去。但在分类过程中样本标签的标定需要特定的仪器以及大量的人力、物力,导致可获的能够使用的有标签样本的数目少之又少,为了解决这一问题一系列的研究方法被提出来:半监督学习,直推式学习,主动学习以及通过特定方法生成另外的虚拟样本。但是在传统的方法中,大部分研究方法都是从全局的特征空间或者标准矩形邻域出发,往往忽视了高光谱图像自身拥有的特定的空间信息和光谱信息,缺乏针对性的解决方法。基于以上的分析,本文提出了基于自适应邻域的方法来解决传统算法中的缺陷,尽最大可能的利用高光谱图像自身特有的空间信息和光谱信息来提高分类精度,本文主要研究内容如下:(1)提出了一种结合自适应邻域和主动学习的高光谱图像分类算法。本模型旨在改变传统主动学习选择样本中的按着在全局特征空间上依照SVM决策面来选择样本导致的被选择样本空间分布不均,且过程缓慢的缺陷。在选择样本进行标记的时候只选择自适应邻域中距离支持向量最远且在图像空间上互相不靠近的样本进行标记,选择出自适应邻域中含有更多信息量的样本加入到训练集中,扩大训练集的规模。在Indian Pines和Pavia University数据图像上验证得出选择这样的样本可以获得更好的分类结果。(2)提出了一种结合自适应邻域和半监督学习的高光谱图像分类算法。本模型旨在改变传统半监督学习基于全局特征空间和空间矩形邻域的方法利用无标签样本来训练分类器中因错误利用样本的方法导致的分类精度不高,甚至在一定次数以后精度下降的情况。在选择无标签样本进行利用时只在训练样本的自适应邻域中选择出和训练样本在类标上分类结果相同的无标签样本加以利用,并给定训练样本的相同类标。通过分类类标一样且同在自适应邻域同时约束,选择的样本给定正确伪类标的可能性大大提高。并且在Indian Pines和Pavia University数据图像上验证得到这样利用无标签样本可以提高分类精度。(3)提出了一种结合半监督学习和堆栈自编码的高光谱图像分类模型。本模型旨在改变深度学习中传统线性组合增加虚拟样本的方法在特征空间线性可分的情况会因组合权值全为正数导致生成大量冗余样本,且在线性不可分的的情况下生成大量的错误伪类标样本。本模型在选择线性组合“母体”样本时,只选择训练样本自适应邻域中的无标签样本半监督的进行线性组合,且组合权值在数值选择上有正有负,并给定训练样本相同类标。紧接着对于生成的虚拟样本通过SVM进行选择,去除冗余样本,使用这样的样本来训练堆栈自编码提取分类特征。并且在Indian Pines和Pavia University数据图像上验证得到这样生成的虚拟样本可以提升分类精度。