论文部分内容阅读
多视图学习利用视图间的互补信息辅助异构特征的融合,有效解决大数据中的异构问题。在多视图研究中,子空间学习将不同视图映射到公共子空间上,以达到特征融合的目的,因而受到了广泛关注。近年来,基于非负矩阵分解的子空间学习算法,能够融合多视图异构特征,实现数据降维,避免“维度灾难”。然而,该类方法对于含噪声的多视图数据仍然面临着一些严峻的挑战。本文基于双图正则化框架和非负矩阵分解技术,针对子空间学习中的降噪问题,研究了多视图数据的公共子空间表示。具体内容包括:(1)提出了一种基于双图正则化的半监督多视图特征学习算法。算法首先将视图分割成视图特定特征和视图共享特征,用以降低无关项对共享特征的影响。然后利用图正则化项来约束数据空间的局部几何结构,最后通过标签信息来构建类内奖赏图和类间惩罚图,以此捕获概念空间的几何结构,从而完成对共享子空间的学习工作。(2)提出了一种基于双图正则化的视图权重自适应的无监督多视图特征学习算法。该算法在分割视图特征的基础上,引入基于数据空间和特征空间的双图正则化框架,维持不同视图在两个空间中的属性结构。此外,为平衡不同视图对共享子空间的影响,本算法为每个视图添加不同权重,并通过一个权重因子对所有视图权重进行控制,从而实现参数自适应的目的。最后,为防止共享特征存在0列的现象,引入l1,2-norm来保持共享子空间的稀疏性。本文所提算法均在标准数据集中进行验证,并选择几种目前多视图学习领域较为典型的算法作为对比。其实验结果相较于其他对比算法表现出了更优的学习性能和更强的鲁棒性。因此,本文所提算法能够学习多视图数据的共享表示,实现含有噪音的高维多视图数据的特征融合。