论文部分内容阅读
近些年在特征选择和降维方面的研究表明,选择的特征应该保留几个重要的结构。这些重要结构包括但不限于全局结构、局部流形结构和判别性信息等。通常可使用稀疏表示和低秩表示等字典学习方法重构数据样本,进而学习全局结构。局部流形结构可通过图学习来保持样本间的局部关系。这些结构可以被许多广泛使用的模型以图的形式捕获,例如两两样本间的相似度图、k-nn图、局部判别模型的全局整合、局部线性嵌入等。显然,许多现有的无监督特征选择方法都依赖于通过某种图进行结构表征,这种图可以在原始特征空间计算出来。一旦确定了图形,就可以在下一个过程中进行固定,并指导搜索有价值的特征,例如稀疏谱回归。因此,特征选择的性能在很大程度上取决于图结构的有效性。然而样本的原始特征往往存在噪声和冗余,从而不可避免地引入不相关或噪声的特征,进而损害后续特征选择性能。为此直接从原始特征空间学到的图结构可能并不合适。本文将低秩表示与自适应图嵌入的思想融合到统一框架中,通过低秩表示和自适应图嵌入学习了转换空间中数据的全局和局部结构,降低了噪声和冗余特征的负面影响。将选择特征、全局结构学习和局部流形结构学习统一框架中,使其同时进行,提出了联合低秩表示与图嵌入的无监督特征选择方法,并提出其优化算法求解模型。更进一步,在样本重构过程中考虑到选择特征的判别性信息,使重构过程不仅保持样本的全局结构,而且选择样本的显著特征使得所选特征更具有判别性。提出了低秩保持重构和图嵌入的无监督特征选择算法并提出其优化算法求解模型。为了验证本文所提模型的性能,将联合低秩表示与图嵌入的无监督特征选择方法,在公开的UMIST、JAFFE、ORL32、MFEA以及COIL20数据集上进行实验。低秩保持重构和图嵌入的无监督特征选择算法在COIL20、LUNG、JAFFE、USPS和MFEA五个公开的数据集上进行实验。实验表明,本文所提算法均具有良好的收敛性,通过与不同算法进行比较,其准确率均具有不同程度的提高。我们还进一步研究所提方法中各参数的影响,实验结果表明本文所提方法,对参数具有一定的鲁棒性。所以,改进后的算法具有良好的收敛性和鲁棒性,并更准确地学习数据的本质结构。