【摘 要】
:
随着计算预算和数据可用性的空前增加,深度模型在目标识别任务中取得了优异的性能。然而,机器学习机制仍然无法与认知学习相比,认知学习不仅可以持续地获取新知识并保存大部分经常用到的旧知识,还能在少量注释样本上构建高精度的识别能力。小样本类增量学习(FSCIL)是一种受认知学习启发的新兴机器学习范式,给定具有足够训练数据的基类和来自新类的少量可训练样本,FSCIL使用旧类训练一个表示模型,然后不断地使模型
论文部分内容阅读
随着计算预算和数据可用性的空前增加,深度模型在目标识别任务中取得了优异的性能。然而,机器学习机制仍然无法与认知学习相比,认知学习不仅可以持续地获取新知识并保存大部分经常用到的旧知识,还能在少量注释样本上构建高精度的识别能力。小样本类增量学习(FSCIL)是一种受认知学习启发的新兴机器学习范式,给定具有足够训练数据的基类和来自新类的少量可训练样本,FSCIL使用旧类训练一个表示模型,然后不断地使模型适应新的类。然而,FSCIL面临着超出传统学习范式的挑战。一方面,用新类微调模型会扰乱旧类的特征分布,从而导致“灾难性遗忘”。另一方面,仅使用来自新类的少数样本进行训练,将使得模型偏向于旧类,从而导致分布崩溃和模型过度拟合。针对上述问题,论文研究利用少量样本进行增量学习的能力,并解决“灾难性遗忘”和过拟合问题。针对“灾难性遗忘”,论文提出一种“避免近期偏好的自学习掩码分区增量学习”方法,简称ASPIL。它包含“区域隔离”和“区域集成”两阶段,二者交替迭代实现持续的增量学习。“区域隔离”利用剪枝技术独立新学习过程以减少对现有知识的干扰。“区域集成”采用特征掩码和双分支信息融合方法以达成统一的、高精度的认知。为评估所提出方法的效用,在增量学习基准数据集上系统地进行了消融实验,并与最新的一系列知名方法进行了比较。实验结果表明,ASPIL提高了人工神经网络的记忆能力,与最新知名方法相比识别率平均提升了5.27%以上。针对FSCIL的过拟合问题并结合上述“灾难性遗忘”的研究成果,论文进一步提出了一个“基于VAE采样回放的元小样本类增量学习”网络,简称VMIL。VMIL在增量学习过程中以在元训练集上训练的深度网络来快速适应新任务,并接受蒸馏损失和间隔损失的约束,以缓解“灾难性遗忘”和避免类间混淆。VMIL还使用隐变量的特征分布来召回旧类样本。隐变量通过变分自动编码器进行降维,然后存储这些隐变量来扩展增量类的特征表示能力并减少过拟合。论文提出的VMIL方法为“灾难性遗忘”和过度拟合问题提供了系统的解决方案。实验表明,VMIL在基线方法上显著改进,达到了新的技术水平。
其他文献
目标识别作为图像感知和视觉领域的一项基础任务,其性能的好坏将直接影响后续中高级任务的性能,进而决定着人工智能在特殊场景中的应用。最近几年,随着深度学习的发展,目标识别方法也取得了巨大的突破。但是现有的方法在面对复杂场景中的小目标识别和缺少标注数据的小样本目标识别上依然存在一些困难尚未解决。本文针对现有问题,从两方面进行分析,首先利用深度学习的目标特征感知能力和强化学习的序列搜索能力来解决小目标识别
在日常获取图像的过程中,受物体移动或相机移动等外界因素的影响,导致所拍摄照片会产生图像畸变。运动模糊是一种常见的图像退化问题,运动模糊图像复原技术一直以来是图像处理方向的研究热点,研究人员根据模糊核是否已知将图像去模糊方法划分为两类:模糊图像盲复原方法和模糊图像非盲复原方法。本文深入研究了运动模糊图像盲复原技术,对现有方法存在的缺陷进行了详细分析,提出了一种全新的基于多阶段的运动模糊复原网络,提高
图像超分辨率重建技术是指在同一场景下,从低分辨率模糊图像到高分辨率图像转换的一种特殊方法。近年来,由于其具有广泛的实际应用价值和深远的理论意义,这种技术已经被广泛地应用于计算机视觉、图像处理等领域。由于将生成对抗网络用于图像超分辨率重建可以获得更高的质量和更好的视觉体验,所以与生成对抗网络有关的研究受到了极大的重视,但是该网络在模型重建中存在尺度单一和获取高频信息不充分的弊端,导致生成的图像有强烈
随着互联网的快速发展,移动应用数量激增,同时移动应用产品功能趋于多样化与复杂化,由此引发的GUI测试问题也越来越具有挑战性。现有的移动应用GUI测试方法中,传统的手工测试存在高成本、低效率、强依赖等问题。而主流的自动化测试方法,money随机测试难以复现bug,录制回放技术需要大量人工操作。因此,如何实现快速高效的移动应用GUI自动化测试成为当前移动应用测试的研究热点。GUI测试建模是实现GUI自
知识是对“识”的理解和描述,也可以说知识就是智能。但目前的主流认知是知识是人类在实践中认识客观世界的结果,这种认识并没有对认识的主体进行讨论。在人工智能领域,为了建立一个基于共识的知识库来表现智能,出现了专家系统、神经网络、知识图谱等模型,这些模型对知识的研究不够深入,且知识库不会随外界更新。因此为了建立一个全面、基于自我意识、可以随外界更新的知识库,本文在知识表示研究的基础上,将知识融合任务分成
现代战争中,无人机在空战和空地联合作战中都占据重要地位并发挥着巨大作用。然而,从战术任务起飞点出发,躲避所有障碍物并且避免敌方探测器的嗅探和攻击,安全飞行并最终到达任务终点,是无人机在诸多战术应用中的首要任务,是执行一系列任务的前提和保障。因此,无人机需要一条满足任务需求的飞行路径,需要有效的路径规划方法来获得。除此之外,无人机战术路径规划的常规仿真方案中,无论是环境感知、态势评估、飞行控制、无人
相机在拍摄人脸图时,常常因为抖动、失焦等原因得到模糊图像。而当人脸图像被模糊化时,对人脸识别等高级视觉任务有很大的影响。人脸图像去模糊的目的是从模糊的输入图像中恢复出清晰的图像,从而提高识别精度等。因此,图像去模糊问题是图像复原领域里面的研究重点,而一般的去模糊方法在人脸图像上效果不佳。本文采用生成式学习方法,结合特征矫正模块,实现对模糊人脸图像进行高精度复原,主要工作如下:(1)基于高效自注意力
随着深度学习中卷积神经网络技术发展,现今的卷积神经网络的模型结构应用越加广泛。为了提升模型性能,网络模型通常变得更加复杂,规模日益庞大,且神经网络本身存在计算冗余,使得边缘设备无法满足复杂模型的运算需求。因此深度卷积神经网络的模型压缩工作被广泛研究,使用有效的模型压缩算法可以减少冗余度,让复杂模型转变为轻量模型以适应更丰富的应用场景。本文主要工作研究了轻量化卷积神经网络和结构化模型剪枝技术。首先是
随着计算机图形学、数字图像三维处理在口腔数字化方面的快速发展,计算机在口腔诊疗领域有着广泛的应用。本课题着眼于数字化口腔医疗的发展和推广,在牙齿尖点的提取和牙齿的三维测量基础上,进行了全牙列数字化评估研究。本文包括以下几个方面的主要研究内容:1)本文以全牙列数字化评估系统在口腔数字化诊疗中的应用为背景,对三维测量技术、牙尖提取方法和现有的评估系统进行了简单的介绍。在此基础上,基于编码结构光技术的相