论文部分内容阅读
机器学习是模仿人类来使机器可以像人一样学习,通过学习一些观测样本,找到样本中潜藏的规律,进而建立模型,来识别未知的样本。传统的机器学习包括监督学习与无监督学习,但两者都有很大的局限性,对于监督学习,标记样本的获取比较费事耗力。对于无监督学习,缺少有类别标签样本的指导,训练出的学习器性能不足。半监督学习兼顾监督学习与无监督学习二者优点,适用于图像分类问题,在少量有类别标签信息样本的指导下,利用大量无标记样本提供的分布信息帮助训练分类器,提高分类器的分类正确率与泛化能力。标签均值半监督支持向量机属于判别式的半监督分类方法,利用无标记样本的标签均值作为约束项,简化了传统半监督支持向量机的复杂求解过程;极小极大标签传播算法属于基于图的半监督分类范畴,构建稀疏近邻图,通过极小极大路径传播类别标签,降低了标签传播算法的时间复杂度。但是这两类算法还是存在以下问题:标签均值没有充分结合图像光谱特征,对于图像分类正确率不高;极小极大标签传播需要构建稀疏近邻矩阵,但是近邻数K的取值不适会造成分类不完全,正确率较低的问题。本文根据这两个问题展开研究,具体的工作如下:(1)针对标签均值半监督支持向量机在图像分类中随机选取无标记样本会导致分类正确率不高,以及算法的稳定性较低的问题,提出了基于聚类标签均值的半监督支持向量机算法。该方法修改了原算法对于无标记样本的惩罚项,首先对选取的无标记样本依据光谱特征聚类,然后使用聚类标签均值替换标签均值,来训练分类器。实验结果表明使用聚类标签均值训练的分类器大大减少背景与目标的错分情况,提高了分类的正确率以及算法的稳定性,适合用于图像分类。(2)极小极大标签传播是一种基于图的半监督分类方法,具有时间复杂度低的优势。该方法需要利用K近邻图构建稀疏相似度矩阵,对于不同的数据,如何确定K的值是个问题;如果固定K值,可能因为其值不合适导致图不连通,从而出现标签传不到某些数据的情况,即有的数据不能被分类的问题。本文提出了一种基于自适应近邻的极小极大标签传播的方法。该方法针对图像分类问题,首先计算出每个样本点的自适应近邻,然后构建稀疏相似度矩阵。实验证明自适应近邻不仅解决了选取的K值不合适而造成的图不连通问题,并且提高了算法的分类正确率。(3)将极小极大标签传播算法与自适应近邻的极小极大标签传播算法应用于高光谱遥感图像分类,结合低秩恢复技术,提高了两种算法对于高光谱遥感图像的分类正确率。将极小极大标签传播算法、拉普拉斯支持向量机与自适应近邻的极小极大标签传播算法应用于多光谱遥感图像分类,结合meanShift平滑算法,提高了三种算法对于多光谱遥感图像的分类正确率。