论文部分内容阅读
高光谱遥感图像分类问题是遥感图像领域中最为经典的科研问题之一,提高其分类精度和计算效率对精准农业、军事防伪、城市规划等方面都具有极其重要的意义。因此,设计高准确率、高时效性及高鲁棒性的高光谱遥感图像分类算法仍是众多科研工作者的研究重点。现有高光谱遥感图像分类算法都是基于训练样本完全正确标注的假设前提下设计实现的。然而,由于多种客观因素的存在,在实际标注过程中极难满足上述假设条件,进而导致高光谱遥感图像中部分样本被错误标记(即,不确定样本问题)。针对上述问题,本文将不确定样本视为整个训练集中的异常数据,拟通过设计多种高光谱遥感图像不确定样本关键检测与剔除算法,最大程度上降低不确定样本对高光谱遥感图像分类算法造成的影响及干扰。其中,本文主要的工作概括如下:协同表示(Collaborative Representation,CR)异常检测算法主要通过获取、对比各个像素的残差信息,进而判断各个像素的异常程度。因其优异的检测性能,CR算法被广泛应用于高光谱遥感图像异常检测研究领域。因此,本文在引入基于残差度量的CR算法基础上,提出一种类依属协同表示(Class-Dependent Collaborative Representation,CDCR)高光谱遥感图像不确定样本分类算法,用于检测、识别高光谱遥感图像中的不确定样本。具体解决思路如下:首先,计算每一类训练样本的Tikhonov正则化权重矩阵,可以大致估计同类训练样本之间的差异程度。然后再利用CR算法分别获得每类训练样本的残差值。实验结果显示,样本残差值越大,被识别为不确定样本的概率就越大。最后,利用这一特性,通过设计的决策函数对不确定样本进行有效检测与剔除。实验结果表明,该算法可以有效检测高光谱遥感图像中的不确定样本,同时改善高光谱遥感图像分类性能。密度峰值(Density Peak,DP)聚类算法可以准确获取高光谱遥感图像中每个像素的密度信息,进而有效度量其离散、异常程度。因此,本文提出一种基于DP聚类的高光谱遥感图像不确定样本分类方法。首先,利用相关系数(Correlation Coefficient,CC)度量算法计算同类训练样本间的光谱距离。其次,利用DP算法得到每个训练样本的局部密度信息。通常来说,不确定样本往往具有较低的密度信息。最后,采用基于局部密度的决策函数对不确定样本进行检测。在多个真实高光谱数据集中进行的实验结果表明,该方法可以有效利用样本的密度信息对样本的离散和异常程度进行准确度量,在保证高检测效率的基础上,可同时实现更加优异、更加鲁棒的不确定样本检测性能,且有助于提高高光谱遥感图像的分类性能。基于密度峰值的高光谱遥感图像不确定样本分类算法虽然可以获得较好的检测结果,但是其仍未考虑各个像素的空间上下文信息。因此,为了进一步提高不确定样本检测精度,本文设计一种基于空间密度峰值(Spatial Density Peak,SDP)聚类的高光谱遥感图像不确定样本分类算法。所提出的方法具体包括以下步骤:首先,获取每个训练样本周围局部邻域内的所有样本。接着,充分利用样本空间上下文信息,选用局部邻域内与中心样本相关程度较大的部分样本作为候选样本对中心样本进行度量,进而计算出同类训练样本间的相关系数。将局部邻域内相邻样本的不同选择规则分别定义为SDP和K-SDP。然后,将上述得到的相关系数矩阵作为DP算法的先验输入信息,计算每个训练样本的局部密度信息。最后,利用本文设定的决策函数对具有较低密度信息的不确定样本进行有效检测。在四种常用的高光谱数据集中进行的实验结果证明通过引入空间信息可以更加准确、有效地对不确定样本进行检测。综上所述,针对高光谱遥感图像中不确定样本分类算法,本文利用多种度量算法,设计了多种不确定样本检测算法。并通过实验分析证明了所提算法的检测性能及鲁棒性,为高光谱遥感图像不确定样本分类问题提供新的解决思路。