【摘 要】
:
多视图数据是指对同一物体从不同视角进行描述的多个特征子集。充分挖掘视图间的一致性和互补性信息,对来源不同的特征子集加以融合进而做出更合理的决策是多视图学习的主要目标。典型相关性分析(CCA)是多视图学习中的重要方法,旨在为各视图寻找一个公共子空间以最大化视图间的相关性。传统的CCA方法只能处理两个视图的线性关系,无法应用于包含多个视图的、非线性的数据集。如果将CCA作为一种降维方法应用到分类、回归
论文部分内容阅读
多视图数据是指对同一物体从不同视角进行描述的多个特征子集。充分挖掘视图间的一致性和互补性信息,对来源不同的特征子集加以融合进而做出更合理的决策是多视图学习的主要目标。典型相关性分析(CCA)是多视图学习中的重要方法,旨在为各视图寻找一个公共子空间以最大化视图间的相关性。传统的CCA方法只能处理两个视图的线性关系,无法应用于包含多个视图的、非线性的数据集。如果将CCA作为一种降维方法应用到分类、回归等识别任务中,由于标签信息被浪费,将不利于任务效果的提升。针对上述问题,大量非线性的、针对多个视图的、有监督的基于CCA的多视图学习方法被提出。本文主要开展基于CCA的多视图学习方法研究,一方面对现有的经典扩展方法进行理论和实验相结合的对比分析;另一方面,在现有方法的基础上,创新性地提出两种新的基于CCA的多视图学习方法,分别适用于大数据集和高维度小数据两种情形。希望该工作能够为多视图学习方向的研究者提供更完整的视角和新的研究思路。本研究主要包含以下三部分内容:(1)对基于CCA的多种扩展方法进行了对比分析。首先详细介绍了部分经典的基于CCA的多视图学习方法,从原理上分析了方法间的相似性和差异性,然后在12个公开数据集上对比了18种方法在无监督的相关性映射任务和有监督的分类任务中的性能差异,并探究了映射之后不同的视图融合方式对分类准确率的影响。这一工作可以为研究者在具体的任务中选择基于CCA的多视图学习方法提供参考。(2)设计了一种端到端的典型相关性分析网络e CCAnet。该模型将视图的非线性映射和相关性映射集成到深度神经网络中,使用梯度下降进行典型向量的学习。相比其它基于深度神经网络的模型而言,e CCAnet实现了视图直接从原始特征空间到相关空间的映射,有效简化了训练流程。实验结果证明,在两个视图和多个视图的相关性映射任务中,e CCAnet都明显优于现有方法,在取得高相关性的同时实现了更低的视图内信息冗余;在有监督的分类任务中,e CCAnet的分类准确率高于单视图和无监督的模型,再次证明了模型的灵活性和有效性。(3)提出一种新的判别式稀疏广义典型相关性分析方法(DSGCCA)。该方法结合广义CCA中将不同视图映射到共同子空间的思想,将单视图降维方法扩展到多视图学习中。DSGCCA解决了基于CCA的多视图学习方法处理高维度小数据集困难的问题,不仅充分利用了标签信息,使得该多视图降维方法更适用于分类等任务中,而且可以处理包含任意多个视图的数据集。实验结果表明,相较于其它基于CCA的多视图方法而言,分类准确率有明显提升,证明了所提出方法的有效性。
其他文献
婴幼儿血管瘤,以下简称血管瘤,是小儿临床最常见的软组织肿瘤之一。血管瘤1岁之前的发病率高达10%-20%,大部分可自动痊愈,但是部分严重的会威胁到婴儿的正常生长乃至生命。准确判别血管瘤风险等级并采取相应的治疗措施,这一工作目前主要是由具有较高专业素养的儿科医生手动完成。高专业素养儿科医生的缺失,部分家长对血管瘤风险的忽视,容易耽误血管瘤的及时治疗。使用人工智能的方法,对血管瘤的状态做出自动且准确的
基于MRI图像的自动分割算法在计算机辅助诊断及治疗等方面有着广泛应用。近年来,基于深度学习的图像分割技术快速发展,但在精确度和鲁棒性上依然不能完全满足严苛的临床要求。比如,现有分割方法有时难以区分器官与组织的边界,对小器官的分割效果也不甚理想。本文针对MRI图像多器官分割中的难点,研究了网络特征的间隔弥合问题及解耦问题,并通过改进网络结构及损失函数,提高分割精度。在MRI图像多器官分割网络中,经常
隐身能力是新一代军用武器的重要特征之一,隐身技术发展在军事领域具有重要意义,其关键在于降低目标的雷达散射截面(Radar Cross Section,RCS)。目前研究多数集中在镜面散射的RCS缩减问题,而在实际应用中,对于目标的细长部位,通常还存在较强的表面行波散射,不可忽视。本研究以高阻抗表面(High Impedance Surface,HIS)为研究对象,同时结合频率选择表面(Freque
非小细胞肺癌(Non-small-cell lung cancer,NSCLC)是一种最常见的肺癌类型,具有高发病率与死亡率的特点。准确地预测NSCLC癌患者的生存期与分子亚型可以为临床医生制定个性化治疗方案提供指导,对改善患者预后、提高长期生存率具有重要意义。随着高通量技术的迅速发展,NSCLC患者的临床与多组学数据被大量收集,为开展广泛的预测研究提供基础。已有研究表明融合临床与多组学数据对NS
随着自动化、智能化逐渐普及以及计算平台性能的提高和成本的降低,机器视觉技术在路面等自然场景中有了更多的应用。目前目标检测框架大多使用端对端的深度神经网络结构,需要进行大量的卷积操作,极其依赖GPU硬件的算力,成本较高,且需要大量训练集训练来保证检出效果。本文设计了一个用于垃圾清扫车上的车载垃圾识别算法,用来辅助垃圾清扫车完成垃圾清扫任务。通过车载相机拍摄路面图片,检测出路面中的垃圾目标,根据垃圾种
近几十年来计算机视觉技术飞速发展,自动目标识别技术在民用军用中的作用也日益突出,在行人检测、智能驾驶、无人机作战等实际场景中均得到了广泛应用。随着自动目标识别技术的发展,如何综合地评价基于不同模型的目标识别算法的性能,是实际应用中十分重要的问题。本文针对自动目标识别算法的性能评价问题,以一些目前主流的自动目标识别算法为对象,设计了一套性能评价指标体系,并提出了一种性能评价方法,对目标识别算法在行人
形状匹配问题是形状识别、形状检索、形状模型重建等关键技术的研究基础,主要可分为刚性形状匹配与非刚性形状匹配。其中,非刚性形状匹配问题由于受到复杂变形因素的影响,实现匹配难度更大,也更具有挑战性。传统的非刚性形状匹配算法,大多基于手工设计的特征描述子,通过特征之间的相似性度量来实现。然而在形状拉伸、扭曲、等距变形等复杂变换影响下,手工设计特征往往存在区分性差、鲁棒性低等问题。近年来,深度神经网络由于
<正>2020年初,新冠肺炎疫情爆发,对全球民航业带来前所未有的巨大冲击,必将深刻影响未来发展格局。现就疫情之后全球航空业的发展情况进行分析。全球航空业发展基本特性特性1:从历史数据来看,全球民航市场发展与经济社会发展速度、发展质量紧密相关,平均年增长率约为全球GDP平均年增长率的2倍或以上,在经济稳定发展时期民航增长也保持稳定态势,但经济波动时民航的波动幅度远大于经济波动(如图1),堪称经济的"
目标检测是计算机视觉研究领域的一个基础课题,在自动驾驶,工业制造以及医疗等应用领域也有重要的应用价值。其中,目标的定位精度不仅仅是衡量目标检测的重要指标,对其应用也有显著的影响。本文以经典的Faster R-CNN为例,从样本分配、网络结构以及损失函数三个角度出发对模型进行分析和改进,以提升模型的定位精度。主要研究工作简述如下:(1)提出了基于动态样本分配的目标检测算法。原始的目标检测算法通常是基
锂电池因具有高功率密度、无记忆效应、使用寿命长等优点,在军事、交通、电站等领域具有广阔的应用前景。为了满足实际使用中不同的功率需求,通常将单体电池进行串并联连接形成电池组。对电池组中发生异常衰减电池进行定位处理,是保障储能系统高性能安全输出、避免故障甚至危险的关键。为此,本文针对电池组中异常衰减电池从识别定位、状态估计和维护决策三方面展开深入研究,旨在系统性地解决电池组中异常电池的精确定位、估计和