【摘 要】
:
人类和动物可以持续地积累和巩固从先前观察到的任务中获取的知识,并通过不断地学习,解决新的问题或任务。然而,对于机器学习系统来说,这样的持续学习能力是重大难点之一,因为不断地从非平稳数据分布中获取可用信息通常会导致灾难性遗忘。近年来随着深度学习的发展,许多克服灾难性遗忘的方法相继涌现,但持续学习仍然是人工智能领域长期面临的挑战。针对持续学习领域中依然存在的一些问题,本文结合贝叶斯优化和变分推理,提出
论文部分内容阅读
人类和动物可以持续地积累和巩固从先前观察到的任务中获取的知识,并通过不断地学习,解决新的问题或任务。然而,对于机器学习系统来说,这样的持续学习能力是重大难点之一,因为不断地从非平稳数据分布中获取可用信息通常会导致灾难性遗忘。近年来随着深度学习的发展,许多克服灾难性遗忘的方法相继涌现,但持续学习仍然是人工智能领域长期面临的挑战。针对持续学习领域中依然存在的一些问题,本文结合贝叶斯优化和变分推理,提出了基于不确定性和资源释放机制的持续学习算法,并在此基础上将正则化操作提升到神经元层面。主要研究工作如下:1.为了更高效地进行贝叶斯推理,以高斯混合分布作为先验,并结合变分推理和蒙特卡洛采样的方法,通过最小化模型真实后验分布与先验分布间的距离优化出一个贝叶斯模型。为了能让模型适应增量式场景,引入参数重要性判断机制,根据贝叶斯神经网络携带的不确定性(概率分布的标准差)动态地调整参数的学习率,避免重要性较高(不确定性较低)的参数被过度调整。然后,为了促进未来任务的学习效率,提出一种资源释放机制,通过引导模型从旧任务中选择性舍弃部分资源,为后续任务的学习提供更多空间。2.虽然采用蒙特卡洛采样的方法对贝叶斯模型的真实后验进行求解能更精确地近似模型的真实后验,但多次蒙特卡洛采样会使模型的运算时间过长且效率较低;此外,第一项工作仍然停留在权值层面,即根据单个权值的重要性为权值施加不同强度的限制,这种方法一是会导致流向神经元的信息产生冲突,二是会产生大量参数,同样会影响模型的计算速度。针对上述问题,提出一种基于神经元正则和资源释放机制的增量学习方法。首先,通过假设模型所有变量间相互独立,然后将KL散度项分解为多个独立一元高斯分布后进行解析计算,节省了更多计算成本;其次,以神经元为单位对输入权值进行分组并按组将权值的方差限制为相同的值,再以统一后的方差作为重要性判别依据对权值进行正则。在MNIST,Fashion-MNIST和CIFAR10三个公开数据集上进行性能评估,实验结果显示,在几种不同规模的神经网络中,本文提出的方法都保持着最高的分类精度,且当网络规模缩小时,本文方法的分类性能也保持着最小的下降幅度。
其他文献
近年来,随着深度学习的快速发展,基于深度学习的单目标跟踪在算法性能方面也得到大幅度提升,而这一部分的提升很大程度上源于使用深度神经网络提取到的深度特征具有良好的分辨能力。目标跟踪在实际应用中存在以下问题,首先,小样本数据量不足、样本多样性低,导致网络提取到的特征数量有限。其次,在遮挡、形变和快速移动等因素的干扰下,目标跟踪精度低。针对上述问题,提出一种小样本目标跟踪算法,主要研究方向和创新点概括为
随着移动互联网、地图测绘和室内导航技术发展,基于位置的服务受到了极大地关注。据统计人们平均80%的时间是在室内,数据连接应用平均80%也在室内,在室外广泛使用的卫星定位技术全球定位系统和北斗定位系统仅仅支持室外定位,在室内复杂环境中无法进行精确地位置服务。随着数字化时代的到来,无线技术的迅猛发展,移动技术得到了广泛的应用,人们开始了对室内定位技术的研究和探索。由于单一定位技术存在精度有限、稳定性不
人脸检测是一种通过计算机算法对输入图像进行人脸目标查找的技术,人脸检测技术在智能安防、人流统计和刑侦破案等场景具有广泛应用。近年来人脸检测借助卷积神经网络技术使得检测精度取得了巨大提升。在实际运用场景中,由于图像背景物体复杂,人脸特征与背景高度融合和人脸目标尺度过小,使得人脸检测精度降低,因此需要对复杂背景下的小尺度人脸检测进一步的研究。论文基于YOLOv3和YOLOv4目标检测模型,研究复杂背景
我国高校教育扶贫工作是国家精准扶贫政策中一项重要的内容。目前,国家教育扶贫工作主要包括贫困生的资格认定和贫困生贫困等级的划分。信息化管理系统的应用为贫困生数据信息的采集提供了很大便利,但由于这些贫困生数据未经有效处理,导致了大量的数据堆积,同时也存在着诸如数据缺失、数据噪声及数据冗余等质量问题。对贫困生数据进行科学高效管理,进一步利用数据挖掘方法提高贫困生认定及贫困等级划分的准确率,从而更有针对性
在信息化时代,网络信息安全技术在云环境下得到广泛应用及普及,同时,错综复杂的云环境体系结构也为客户端提供多样的云计算服务,在为人们生活、工作、学习带来诸多便利的同时,也给人们带来多方面的信息被泄漏、攻击、窃取等网络安全风险。因此如何利用网络安全技术去解决云计算应用中遇到的隐私安全、身份认证问题已经成为安全人员研究关注的焦点,本文主要在不同的安全认证体系之中面向云环境跨体系访问资源认证合法身份问题,
近年来,在各种工程和生物应用的推动下,垂直圆管内外壁的粘性流体覆膜成为了研究热点,尤其在管壁保护层的涂覆,光纤、导线电缆表面的覆膜等方面受到了广泛的应用。目前已有的对流体薄膜厚度的测量方法多数为接触式测量,然而接触式测量结果的可靠性和测量精度等级不高。本文为了深入研究圆管内壁覆膜动力学特性,设计了一套非接触式测量圆管内壁覆膜的实验装置,以及开发了一款数字化提取覆膜过程与瞬时流态的图像处理GUI界面
孔加工作为机械加工的基本工艺之一,在机械制造过程及加工工艺中具有无可替代的重要地位,其中小深孔加工是孔加工中重要分支,也是孔加工技术的难点。在小深孔加工过程中,钻头需要在封闭的环境中进行钻削,该加工技术是涉及断裂力学、热力学、材料力学等诸多理论的复杂动态变形过程,难以建立该过程的精确数学模型,从而导致经典的控制方法很难控制复杂多变的钻削状态,因此研究小深孔钻削过程的状态检测方法及自适应控制策略具有
无线电波信号穿过电子密度不规则体时,无线电波信号的相位、强度和偏振方式等发生不规则变化,即电离层闪烁。电离层闪烁现象严重威胁着卫星通信、导航定位、雷达监测等无线电系统性能。全球导航卫星系统(Global Navigation Satellite System,简称GNSS)广泛应用于社会生产生活中,人们对GNSS的依赖日益增长。因此,GNSS电离层闪烁预报成为了空间天气研究的热点。低纬地区GNSS
社交网络的快速发展促进了信息分享的广泛发生,为用户带来便利的同时,也产生了严重的隐私泄露问题。除传统的差分隐私、k匿名等隐私保护技术之外,使用新兴人工智能技术,借助于智能体高效实现隐私保护,也成为了信息安全领域的研究热点。其中,基于智能体的隐私协商可以协助社交网络用户在信息分享前建立隐私保护共识,具有一定的隐私泄露预先防护作用。可追责是行为或后果的责任主体可被追究的属性,是透明、可解释人工智能应用
随着影像组学和计算机辅助诊断等医学影像技术的不断发展与应用,医学图像中一些关键的解剖点的位置的确定对于后续的建模和分析的过程有着重大的意义。目前在医学图像分析的研究中,解剖点的检测大多依赖医生手动进行标记,这种手动的检测方式不仅浪费了医生宝贵的时间和精力而且检测结果的准确性会受到医生的工作状态、临床经验等一些主观因素的影响。因此医学图像解剖点自动检测的研究对现代医学的发展与进步有重要意义。本文针对