论文部分内容阅读
机器学习、模式识别、信息检索和生物信息中面临着一个主要的问题:维数灾难,因此维数约简方法的研究越来越有必要。本论文以合成孔径雷达(SAR)图像目标识别、高光谱图像分类与人脸识别为应用背景,针对谱聚类算法自身具有的维数约简特性,研究基于谱聚类的维数约简算法。结合国家自然科学基金项目和国家部委科技项目,将所提出的方法应用于SAR图像目标识别、人脸识别和高光谱遥感图像分类中。本论文主要工作概括如下:(1)基于经典NJW谱聚类算法构造了一种谱特征分析方法,在此基础上对尺度参数进行研究,提出了一种基于多参数自调节谱聚类维数约简算法,并将其应用于手写体数字识别和SAR图像目标识别。多参数自调节谱特征与传统特征变换方法得到的特征相比,提高了后续识别精度。此外,自调节参数避免了手动调节全局尺度参数的麻烦,由于自调节尺度参数考虑了各个样本点自身的邻域统计信息,比给所有的样本点赋予相同的全局尺度参数更合理。(2)在构造谱聚类图切判据的过程中加入已知类别样本点的类别信息,提出了一种基于新的谱聚类图切判据——标度切判据的监督维数约简算法。同时,为了降低计算复杂度,提高算法的推广性能,在构造切判据的过程中只考虑k-近邻之间的类间和类内不相似性,这样能放松数据的类内方差,增大数据的类间边缘,从而获得更合理的投影矩阵。从人脸识别及高光谱遥感图像分类实验结果可以看出,基于局部标度切判据监督维数约简算法提取的特征能得到更好更稳定的识别结果。在局部标度切判据监督维数约简算法基础上,借鉴最优维数判别分析方法思想,提出了最优维数标度切判据分析方法。实验结果表明,最优维数判别分析方法能够获得满意的结果。(3)基于标度切判据监督维数约简算法,使用核技术提出了一种核标度切判据监督维数约简算法,从而扩大了其应用范围。当原始特征维数大于样本数时,线性标度切判据监督维数约简方法会出现奇异问题,而该方法避免了此问题,对原始数据的原始特征维数没有限制。将基于核标度切判据的监督维数约简方法用于SAR图像目标识别,实验结果验证了该方法在SAR图像目标识别领域的应用潜力。