基于随机敏感度的增量学习方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:icenum123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
增量学习又称持续学习或终生学习,是指学习模型能不断学习新数据,处理新任务,同时学习模型还被要求不能忘记之前学习过的知识。在未来的学习系统中,增量学习有着相当重要的地位。因为它有效地利用了资源,消除了在新数据到达时需要从头开始重新训练的麻烦。另外它通过限制存储所需的数据量减少了内存的使用。这样的学习模式也更像人类对新事物的学习方式。增量学习面对的主要挑战是灾难性遗忘,即学习模型更关注新数据,而忘记了之前学习过的数据。本文解决的问题是增量学习中的一个子类叫类增量学习,即每次学习模型学习的新数据都来自新类别,学习模型在学习新类别的同时,也要尽量保留对旧类别的记忆。针对该问题,许多学者提出了不同的方法。他们主要分为三类。第一类基于知识蒸馏的方法,他们通过知识蒸馏把旧类知识迁移到学习模型中。第二类是基于参数正则化的方法,他们主要通过正则化方法防止神经网络的权重偏移太多来达到保留旧类知识的效果。第三类是基于生成模型的方法,他们通过生成模型生成旧类别的伪样本或伪特征达到防止遗忘旧类的目的。上面介绍的三类方法通过不同的手段来解决增量学习的灾难性遗忘问题,但这些方法都没考虑到学习模型的泛化能力和稳定性对学习模型的性能的影响。本文提出了一个基于随机敏感度的增量学习(SSIL)模型来解决灾难性遗忘问题。SSIL利用常用的交叉熵损失来学习新知识,利用局部泛化误差模型得到的随机敏感度损失来增强学习模型的稳定性和泛化能力。此外,SSIL采用了两种蒸馏损失来保留来自旧类的知识,一个是通过训练样本计算得到的知识蒸馏损失,另一个是通过计算随机敏感度时生成的样本计算得到的知识蒸馏损失。通过这种方式,SSIL为新旧类保持健壮性和高性能。在CIFAR-100和Image Net ILSVRC2012两个大型图像分类数据集上的实验结果表明,本文提出的方法优于其他先进的算法。具体来说,SSIL在两个数据集上的精度分别比流行的方法i Ca RL分别提高了9.98%和8.98%。
其他文献
学位
近几年随着人工智能技术的高速发展,人脸表情识别在智能安防、测谎、智慧医疗、互联网教育等领域出现了广泛的应用场景。由于人们通过面部表达情感的方式不同,很难通过人工设计和选择特征的方法高效的获取人脸面部表情的特征分布,因此目前基于深度卷积神经网络自动提取面部表情特征的方法在人脸表情识别中发挥出越来越大的优势。由于缺乏大规模的高质量数据、人脸图像中存在部分遮挡以及表情标签的不确定性,自然场景下的人脸表情
学位
学位
学位
学位
学位
学位
随着科学技术的发展和信息显示控制技术的普及应用,各类驾驶舱中控制器开关数量也在增长,扳钮开关控制器也是其中一类。扳钮开关是一类应用性非常普遍的操纵器件,适用于各类驾驶舱、控制室。扳钮开关的布置位置、人的操纵特性和开关操纵方向的规定都直接影响着驾驶员的作业工效、驾驶舱的安全。通过文献调研发现目前大量的研究都针对于扳钮开关的使用寿命方面,对其操纵运动方向上的研究尚少,以及对涉及扳钮开关的设计标准进行查
学位
飞机的运行安全始终是世界民航业持续关注的重点问题。随着飞机软硬件设备的不断升级,传统机载故障造成的飞机不安全事件的发生率越来越小,飞机运行过程中人的因素越来越受到科学家和航空运输企业的重视,科学地分析飞行员的飞行操作特征对进一步保证飞机运行安全、提升飞机运行品质、改进飞行训练等工作具有重要意义。本研究以量化飞行员的飞行操作特征为目标,基于航空公司真实的QAR数据对飞行员操作特征的进行挖掘,并利用相
学位
根据国家运输协会统计分析,80%-90%的飞行事故均由人为因素造成。根据现有的飞行不安全事件与事故调查研究,人为因素与心理胜任力有密切关系,因此飞行员的心理胜任力对民航安全至关重要。飞行学员与飞行员心理胜任力存在一种递进关系,且一脉相承,因此本文对飞行学员心理胜任力进行指标构建与评估研究,对更好地提高飞行学员训练质量,使其更快地进入航空公司工作具有重要意义。本文基于搜集国内外大量文献资料和访问专家
学位