论文部分内容阅读
特征抽取是模式识别研究中的基本问题之一。对于图像识别而言,抽取有效的图像特征是完成识别任务的关键。线性与非线性投影分析作为特征抽取最为经典和广泛使用的方法,在图像识别中已得到了广泛的研究,获取了成功的应用。然而线性与非线性投影分析方法主要针对模式的一组特征进行处理,并不适用于多表示数据的特征融合与抽取。相关投影分析,包括典型相关分析与偏最小二乘,已广泛应用于多组特征间的融合与抽取,并在图像识别中取得了良好的实验结果。本文以相关投影分析为研究对象展开深入的拓展研究,致力于增强相关投影分析抽取特征的鉴别能力。所做的主要工作和研究成果如下:(1)从模式分类的角度出发,提出了一种监督的局部保持典型相关分析(SLPCCA),通过最大类内成对样本与其近邻间的权重相关性,在有效地利用样本类别信息的同时保持了数据的局部流形结构,提高了算法的稳定性与鲁棒性,并且融合了判别型典型相关分析(DCCA)的鉴别信息,而不受其抽取的最大特征维数不超过总类别数的限制。此外,面对图像识别问题中存在的大量非线性问题,在核技巧的基础之上又提出了核化的SLPCCA (KSLPCCA),以提取数据的非线性特征。(2)提出了一种正交正则化典型相关分析(ORCCA)。典型相关分析(CCA)获取的投影向量满足相互之间的共轭正交性,然而“共轭正交”需要考虑样本的总体协方差矩阵,在面对小样本问题中可能会出现由于对协方差矩阵的估计不足而产生算法性能的下降。此外,共轭正交性更加关注特征的低维最优表示而非鉴别能力的强弱,当分属于不同类别的样本分布具有较为明显的差异时,可能会出现分类性能不佳的现象。为了解决这两个问题,本文提出的ORCCA以投影矢量之间的正交性约束与正则化参数的引入,能够抽取出具有更强鉴别能力的特征。(3)提出了稀疏保持典型相关分析(SPCCA)与稀疏正则化的判别型典型相关分析(SrDCCA)。稀疏保持投影(SPP)实现了特征降维过程中对样本间稀疏重构能力的保持,因而能够在无类标签的情况下提取样本的自然鉴别信息。受此启发,本文提出的SPCCA,不仅实现了两组特征集鉴别信息的有效融合,同时对提取特征间的稀疏重构性加以约束,增强了特征的表示和鉴别能力。在SPCCA的基础上,通过对部分已标记样本的监督学习,又提出了稀疏正则化的判别型典型相关分析。在手写体字符与人脸识别上的实验结果表明,本文提出的两种方法均取得了良好的识别性能。(4)基于多表示数据的特征抽取问题,提出了一种多成分分析方法(MCA)。典型相关分析与偏最小二乘,作为两组特征融合与抽取的经典方法,如何将其推广到多组特征,一直吸引着人们广泛的关注。本文提出的MCA,通过高阶张量的构造,将多组特征之间的相关信息融入到协方差张量中,再利用高阶奇异值分解,获取各组特征对应的投影矩阵,实现维数约减与特征融合的双重任务。与基于子空间的特征融合方法(MFFSL)相比,MCA能够利用较少维数的特征表示实现多组特征间的融合,保证了抽取的特征具有更强的鉴别性。另外,主成分分析与偏最小二乘可以分别视作本文方法在面对一组及两组特征时的一种特例情况。在手写体字符与人脸识别上的详细实验,验证了MCA的有效性与鲁棒性。(5)针对图像集分类需将图像矩阵转化为图像矢量的问题,提出了二维互子空间方法与二维多主角嵌入方法。首先,借鉴二维主成分分析(2DPCA)的基本思想,提出了一种二维互子空间方法,避免图像集分类中二维图像矩阵的矢量化表示对图像结构信息的破坏。此外,在综合考虑多组图像集合间的“全局”与“局部”典型相关基础上,提出了二维多主角嵌入方法,以迭代优化方式寻找一组全局鉴别子空间,以满足同类多组子空间主角的最小化与非同类多组子空间主角的最大化。所提方法不仅能够增强子空间表示的鉴别能力,同时亦减少了对存储空间的需求以及新测试样本的分类时间。