深度神经网络模型持续学习能力的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:zibu365H356
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能、深度学习领域的发展,深度神经网络模型得到了广泛的研究和应用。其中,计算机视觉方面的研究也取得了突破性的进展,并有许多研究已经有了具体落地应用,这为人们的生活带来更多的方便。然而,对于神经网络的训练,往往需要基于大量的实验数据,而数据的提供方式在实验场景和实际场景有较大的差别。在实验条件下,数据往往是完整的理想化的,由人工直接提供。但在现实世界中,数据往往是随着时间逐渐提供的。除此之外,在实际应用场景中,连续获得的数据的分布可能随着时间变化而发生改变,这意味着模型获得的数据不完全属于同一分布。这一实际场景要求神经网络模型应该能够具有持续学习新数据特征的能力,而不仅仅只能基于完整数据进行学习,这就需要模型能够从动态数据分布中学习和记住多个任务,这种能力称为持续学习或终身学习。对于人类而言,可以轻易的完成这样的任务,但这对深度神经网络来说是一个长期的挑战。为了解决这个问题,研究者通过模仿大脑的学习机制,提出了很多研究方案。然而,目前的深度神经网络的持续学习能力还远远不够,人工智能方法在这方面还有很长的路要走,这也是本文的目的和意义所在。本文对现有的持续学习方法进行分析,在此基础上提出一种更好的持续学习方案。本文的工作归纳如下:1.针对现有持续学习方法在知识蒸馏损失项不够精确的问题上,本文提出了基于样本记忆和知识蒸馏的持续学习方法,巧妙地将样本记忆和知识蒸馏有效结合,其目的是通过采样获得少量旧任务的样本数据,以提高知识蒸馏的准确性,从而进一步减少旧任务的灾难性遗忘现象,减缓旧任务预测准确率的下降。通过实验,也证明了本文提出的方法在单个、多个新任务场景下的有效性。2.现有持续学习方法不能很好的适应任务差异性较大的场景,当前后任务数据分布有较多偏移时,灾难性遗忘现象更加明显。针对这个问题,本文引入了特征提取参数稀疏化策略,改变原有的多任务间共享特征提取参数的模式,使得不同任务间的节点不完全共用,减少由数据分布差异导致的权值更新冲突,同时不同任务间公用节点的保留,能够实现新旧任务知识共享,从而进一步减少旧任务的遗忘,全面提高新旧任务预测的准确率。具体地,本文首先通过基于Dropout为任务选取特定的节点,提高参数稀疏性;其次,通过对特征提取参数进行范数正则约束,进一步保证参数的稀疏性,减少任务间冲突。总体来说,本文提出的方法将样本记忆、知识蒸馏、参数稀疏化策略结合起来,相互配合,在解决原有持续学习方法不足的同时,将多种策略的优势结合到一起,从而提升模型的持续学习能力。最后,本文通过在不同数据集和网络结构下进行实验,验证了方法的有效性。
其他文献
随着数据时代的到来,互联网上产生了海量的文本信息。由于大量非结构化的文本因其结构松散,内容冗杂,无法直接提取关键内容,给数据管理以及分析和挖掘带来了挑战,因此,信息抽取作为从大规模海量文本中抽取结构化知识的技术受到广泛的关注。作为信息抽取的关键子任务,实体识别和关系抽取是知识图谱,智能客服等自然领域上游任务的基础工作,也是帮助法律、金融、医疗等垂直领域实现文本自动化的关键技术,其任务是从输入文本中
深度脉冲神经网络(Deep Spiking Neural Network,Deep SNN)充分结合被称为“新一代神经网络”的脉冲神经网络(SNN)自带的低功耗、生物可解释性、时序任务可处理性等一系列优点以及深度学习(Deep learning)具备的强大的层次特征表征能力,使得SNN已经在图像处理、语音识别等方面的研究更上了一个台阶。已成功应用到传统人工神经网络(ANN)的多尺度理论(Multi
在二维的计算机视觉,深度学习在许多领域都有了突破性的进展,且在许多方面已经优于传统的计算机视觉方法。点云配准是二维计算机视觉中图像匹配问题的三维推广,目前点云配准主要有两类算法,分别是基于全局分布状态直接求解的变换估计算法和基于局部特征提取的特征匹配算法,前者直接根据全局的分布状态估计点云对之间的变换参数,后者则基于几个步骤:关键点检测、特征描述提取、特征匹配与变换估计。本文将深度学习方法引入到三
随着通信技术与互联网的普及,人们能获取到的信息是之前难以想象的,数据已经变成生产要素在各行各业发挥着重要的作用。由于大部分数据都是未标注的,创建标签又需要花费巨大的人力。聚类方法通过数据内在属性的关联,将其分为若干个类别(簇),能对数据进行有效的分析,以提取有价值信息指导生产。受益于深度神经网络的提出与发展,将传统聚类结合深度学习以利用其特征提取能力被越来越多的研究者所关注。基于自动编码器的深度子
学位
学位
多目标优化问题通常具有两个或两个以上相互冲突的目标。进化多目标优化算法被广泛用于解决多目标优化问题。这种算法可以找到一组兼顾收敛性和分布性的解决方案,同时使得这组解决方案逼近整个Pareto front。然而,相比于整个Pareto最优解区域,决策者通常只对一小部分与其最相关的权衡解感兴趣。另外,为决策者提供大量的非支配解不但会增加其工作量,也会影响决策者的精准决策。因此,在现实问题中,多目标优化
在计算机视觉领域,理解人物目标是关键且具有挑战性的一个话题,而人体解析是实现这一目标的任务之一。人体解析是语义分割的子任务。人体解析是一个密集预测的任务,其目标是定位人体所在区域,并进一步将其划分成多个语义区域。近期,人体解析被广泛应用于其他分析人物目标的任务中,例如行人再识别、姿态估计、人体图片生成等。现有的基于深度学习的方法可以归纳总结为:基于特征增强、基于人体结构、基于多任务学习、基于生成对
近年来无人机、无人小车等智能体因其稳定性高、适应性强、风险小等特点得到了快速发展;智能体集群化解决了单个智能体功能性有限的问题,发挥集群优势的同时对智能个体进行了有效的整合。集群避障一直以来是智能体群体控制的重要模块,大多避障算法在遭遇复杂障碍物环境时容易陷入局部最优值使得智能体无法快速进行障碍物躲避;本文根据智能体集群在障碍物环境任务执行过程中避障需要,对Flocking协同控制算法和Q-lea
随着移动智能设备与物联网等技术的飞速发展,人们的家庭生活水平也稳步提升,如今很多的家庭设备也变得智能化。分布式家庭娱乐系统以此为背景,而且基于家庭生活中的各种智能设备如智能电视、电脑、音响等等,探寻一种智能手机与各种家庭设备相互协作的家庭娱乐体系。在该体系下各种智能设备能够各司其职,如智能电视视听效果好、智能手机轻便易操作,因此分布式家庭娱乐系统解决了家庭设备之间的互联互通问题,且使得每一个设备都