论文部分内容阅读
子空间学习是一个基础和重要的研究课题,被广泛地应用于计算机视觉、图像处理、机器学习和模式识别等领域中,如人脸识别、目标跟踪和图像重构等。作为一个基础研究课题,大量的子空间学习方法在过去的几十年中被提出。本文对具有代表性的子空间学习方法进行了深入的探索和研究,根据其学习方式将子空间学习方法大致分为两大类:基于映射的子空间学习方法和基于表达的子空间学习方法。基于映射的子空间学习方法旨在处理单子空间的降维、识别以及鲁棒重构等问题,该类方法可被纳入到更通用的图嵌入框架中;基于表达的子空间学习方法旨在处理多子空间的鲁棒聚类、重构等问题,该类方法均涉及到稀疏表达和低秩表达。本文基于子空间学习方法中的经典方法-主成分分析方法,围绕如何从数据中提取主要信息成分这一终极目标,对主成分分析方法和稀疏、低秩、及其它子空间学习方法进行深入研究并提出新的模型和优化算法。具体地,本文开展主成分在其解释性、鲁棒性、鉴别性和全局优化解四个方面的算法研究,并取得了较好的创新性成果:第一,提出了具有特征选择能力的像素加权主成分分析方法。本文通过分析传统子空间学习方法和稀疏子空间学习方法之间的异同,建立了图嵌入和稀疏图嵌入之间的关系,归纳了图嵌入学习方法的自回归框架。受自回归框架的启发,引入一致性特征选择的思想,从自回归的角度,提出基于l2,1-范数的像素加权联合稀疏主成分分析方法,使得选择的特征可以直观地解释主成分。实验结果表明,本文提出的方法能够选择最具有代表性的特征从特征层面上来解释主成分。第二,提出了鲁棒联合稀疏主成分分析方法。一组对齐的图像在特征空间中通常具有一致性稀疏的特性,然而图像中的噪声往往会破坏这一性质。为此,本文借鉴凸鲁棒主成分分析方法的思想,提出基于l2,1-范数的鲁棒联合稀疏主成分分析方法。该方法将原始图像分解为重构图像和噪声图像,同时对误差项和正则项进行联合l2,1-范数约束。实验结果表明,该方法正确地分离了图像中的离群点噪声(outliers),从而恢复原始数据内在的特征一致性稀疏特性。第三,提出了基于局部保持的低秩主成分分析方法。基于表达的子空间学习方法往往是从全局表达的角度建立模型,而忽略了数据通常具有的局部近邻结构保持这一重要的先验信息。针对这一问题,本文通过分析基于映射的局部保持投影方法和基于表达的主成分分析方法之间的关系,将局部保持的思想引入到低秩表达的字典构建中,提出基于局部保持投影和低秩表达的双边重构方法。该方法将原始图像分解为双边重构图像和噪声图像。实验结果表明,该方法相较于单边重构方法在流形数据上取得了较明显的鉴别性重构效果。第四,提出了基于样本加权的联合稀疏主成分分析方法。针对现有主成分分析方法在数据中心化时存在的均值累积问题,本文在基于鲁棒联合稀疏主成分分析方法的基础上,引入优化均值变量,提出基于样本加权的联合稀疏模型。该模型的本质是在优化均值鲁棒主成分分析方法的自回归形式上添加具有特征选择能力的正则项,因此更具一般性和普适性。然而,该模型没有全局最优解。通过对模型进一步地等价推导,发现原始模型存在等价形式的凸模型,从而能够保证算法收敛到全局最优解。实验结果表明,本文提出的方法可以选择有效特征用于鲁棒的重构,同时可以使用选择的有效特征进行鲁棒的无监督聚类,均取得较好的实验结果。综上,本文提出的工作主要归纳为两个方面:一方面,通过自回归形式将主成分分析方法和特征选择有效地结合起来,使得提出的方法能够从特征层面上更好地解释主成分,对离群点噪声更具鲁棒性,选择到的特征对原始数据更具表达性;另一方面,将局部保持思想引入到低秩主成分中,从而获得流形数据上的鉴别性重构效果。