基于近邻优化的异构联邦学习算法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:sea0972
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
联邦学习(Federated Learning)作为一种新兴的分布式机器学习范式,可以联合不同的组织或用户共同训练机器学习模型。具体来说,在保证整个训练过程数据一直保留在本地不被泄露的前提下,通过中央服务器协调大量客户端(例如手机、电脑和运动手环等)共同训练得到一个最优全局模型,在保护数据隐私的同时打破了数据之间的壁垒,以此来解决数据孤岛问题。不同于传统的分布式机器学习方法,联邦学习面临诸多严峻的挑战。首先面临数据异构性挑战,即不同客户端之间存在的数据类型以及数据量不平衡的问题,也称数据的非独立同分布(Non-IID)问题;其次是系统异构性挑战,即不同客户端之间由于CPU、GPU、ISP、电池以及网络连接等硬件的差异所导致的本地计算能力严重不均衡的问题。异构性挑战一直是阻碍联邦学习发展的瓶颈问题,因此本文的研究工作主要针对联邦学习中数据异构性和系统异构性展开,基于近邻优化的方法设计更加高效的联邦学习算法,以提高联邦学习的稳定性和鲁棒性。首先,针对由于数据异构性和系统异构性导致的全局模型收敛速度慢甚至无法收敛的问题,本文提出基于隐式随机梯度下降优化的联邦学习算法。在本地模型更新阶段,使用近邻优化算法约束本地模型更新。在全局模型聚合阶段,通过隐式随机梯度下降的方式直接对全局模型参数进行优化,能够使全局模型参数实现更加高效和稳定的更新,从而加快全局模型的收敛速度。其次,针对由于异构性导致大规模联邦学习本地计算、通信和存储效率上不平衡的问题,本文提出基于微批量随机近似点优化的联邦学习算法。主要是在本地模型更新阶段进行优化,首先进行微批量随机采样,然后再利用微批量数据进行损失计算,最后再利用近邻优化算法约束本地模型参数更新。这样就可以使每个客户端节点的计算复杂度更加均衡,提高本地计算效率。
其他文献
随机非线性系统指的是输入输出及干扰项存在随机因素或者系统本身带有某种不确定性的非线性受控系统,它可以在金融、股票清算、电力系统建模和人口动力学等方面提供一个良好的数学建模框架。对于控制系统来说,稳定性是研究控制系统首要解决的问题,所以近些年来,关于随机非线性系统的稳定性问题一直是专家学者深入研究的热点,并取得了一系列优秀的研究成果,但仍有许多关于随机稳定的问题值得近一步讨论和改进。因此本文研究了基
学位
随着科技发展和社会进步,各个领域对预测模型的精度、稳定性要求越来越高。近年来,深度学习中的循环神经网络(RNN)技术,特别是其与另一深度学习技术-卷积神经网络(CNN)相融合的CNN-RNN架构在预测中显示出强大优势。但基于RNN的模型在预测任务中存在滞后性,流行的CNN-RNN架构也未解决上述问题。注意到宽度学习系统(BLS)具有权重计算直接、运算快速高效的优点,本文尝试融合宽度学习和深度学习的
学位
显著性目标检测旨在识别出图像中最显著的对象与区域,目前已经成功地作为目标跟踪、物体识别以及语义分割等计算机视觉领域任务的预处理过程。传统方法大多依靠颜色,纹理等手工特征或者启发式先验来捕获图像的局部细节以及全局上下文信息,受制于特征的表达能力,在复杂场景中检测显著物体的能力大打折扣。近年来,卷积神经网络快速发展,得益于海量的数据以及模型强大的特征表达能力,基于深度学习的算法在性能上有了巨大提升。本
学位
海洋暖涡观测需要多智能体之间的协同以及任务分配,尤其是异构智能体之间的协同可以充分发挥不同智能体之间的特点。在多智能体的暖涡观测中,合理的任务分配可以保证系统以最小的代价完成全部任务,这是多智能体多任务问题的研究热点之一;路径规划是智能体在已知或者未知环境信息的前提下执行任务时,为智能体提供从起始点到终点的可行路线。以上述为前提,本文开展了面向暖涡观测的多智能体路径规划研究,主要研究内容如下:1、
学位
全卷积孪生网络目标跟踪算法由于其很好地平衡了精度和速度的关系而得到快速发展。但是仍然存在一些难点限制其跟踪性能,如背景混杂、遮挡以及形变等。特别是在相似背景信息干扰下会出现跟踪漂移,而且现有的基于锚框生成的目标跟踪算法超参数多,带来额外的复杂度和计算消耗。此外,只利用卷积神经网络提取的单一层语义信息做跟踪预测会导致图像信息利用不充分,不能形成更鲁棒地跟踪,而简单的将多层特征自适应融合的效果并不理想
学位
雾天能见度降低给高速公路的通行效率与安全运营带来了极大威胁,全方位高效的能见度检测对交通管理具有十分重要的意义。随着高速公路监控设备的普及,通过构建基于监控图像的能见度自动检测方法,能够在降低成本的同时实现密集的大范围检测。然而由于成像设备及成像条件存在差异,且监控图像特征与能见度类别之间具有复杂的非线性关系,如何依据图像进行准确的能见度检测是一项具有挑战性的任务。鉴于深度卷积网络优异的特征学习能
学位
运动捕获数据作为一种新型的多媒体数据,在影视,游戏和医疗康复领域都得到了广泛应用。此类数据通过记录每一时刻人体关节点的位置和朝向,构成整个运动帧序列。由于其捕获到的人体位置信息非常的准确,能够在各种复杂的场景中刻画出人物模型的运动,给人以强大的视觉冲击,因此获得了大量用户的青睐。但专业的运动捕获设备价格高昂,所以只有大型的机构或公司才能完成运动捕获的任务。运动合成技术由于能够利用现有的运动数据,通
学位
对于实际应用中的复杂系统而言,通常存在由于多种类型干扰的存在而造成的系统工作效率下降等问题,这种类型的问题也正是整个控制领域重点研究的问题之一。目前已有一些控制算法能够在一定程度上缓解效率下降的问题,但是一般控制系统中,控制器一旦设计完成之后,其参数不便更改。针对此类问题,在多种类型干扰作用的控制系统中,本文在上层通过规划与调度获取最优设定值,然后应用两层结构运行优化控制方法结合其它控制方法来优化
学位
互联网技术的快速发展极大地降低了人们接收和发布信息的门槛。海量的网络文本包含民众对事件与商品的看法,通过大数据分析以及情感挖掘能够帮助政府了解事件的舆论走向,也能为推荐系统提供数据支撑。面对指数级增长的评论文本,传统的情感分析方法已捉襟见肘,因此本文以深度学习方法为基础,围绕目前情感分析中存在的文本特征表示不充分、不准确的问题展开研究,面向不同类型的情感分析任务构建更准确的文本特征表示方法,本文的
学位
近年来,机械臂在现代工业制造体系中扮演了不可或缺的角色,随着生产工艺的提升,对机械臂的轨迹跟踪控制要求也越来越高,由于目前大多数控制研究只能使系统渐近收敛,研究高精度、快速收敛的跟踪控制算法有着重要的意义。本课题基于非奇异终端滑模(Nonsingular Terminal Sliding Mode,NTSM)有限时间收敛特性,将NTSM分别与神经网络、自适应控制、扰动观测器结合设计轨迹跟踪控制器,
学位