非独立同分布数据下的聚类联邦学习方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:X395381435
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今移动设备与物联网设备收集了大量数据用于学习模型以改进用户体验,由于这些数据通常隐私敏感,或规模巨大,因而很难将这些数据全部发送到数据中心,随后联邦学习被提出来解决这一问题。联邦学习实现了跨设备场景下的协同学习,同时保持了客户端数据的本地存储从而保护隐私。但联邦学习也面临非独立同分布数据问题。为解决非独立同分布数据问题,各种方法被提出。但其中在模型准确度与收敛速度与的提升不足,或者违背了联邦学习的原本假设。此外,没有方法考虑在增量环境下的适用性。为此,本文研究了非独立同分布数据下的联邦学习方法。本文首先研究基于聚类算法的联邦多任务学习。在联邦多任务学习的基础上,该方法为小组而非个体客户端训练模型,从而消除了全体客户参与训练的限制。并且设计了客户端聚类策略确保本地数据分布相似的客户端被分到同一组,从而提高模型准确度。随后为各小组构造关系矩阵改善近端优化的效果,从而促进各小组间的互相学习。实验结果表明该方法相比其余方法在非独立同分布数据下达到了更高的准确度与更低的通信开销。本文进一步研究基于聚类算法的联邦增量学习。通过应用基于架构的增量学习,该方法解决了联邦学习在增量环境下的灾难性遗忘问题。并且借助层次聚类算法执行知识模型的扩展与构造,从而控制知识模型的数量。随后使用异步联邦优化方法改善收敛程度不同的知识模型间的近端优化的效果。实验结果表明该方法能同时克服非独立同分布数据与增量环境两大挑战。
其他文献
2022年北京冬季奥运会成功申办对我国冰雪运动的发展具有重要的推动作用,随着冰上运动场馆建设标准的不断发展,我国冰上运动场馆正处于增量与存量更新并存的时期,需要结合相应理论对冰上运动场馆的更新与改造进行研究。在此背景下,本文针对既有冰上运动场馆的使用现状,通过调研与访谈,总结基本问题,搭建设计理论框架,从使用后评估三个基本维度即空间环境、功能效益和建筑性能表现提出基于使用后评估的既有冰上运动场馆改
学位
历史文化街区对文化传承及历史文脉保护有至关重要的作用,目前国家和地方政府出台了一系列文件,旨在加强和规范历史文化街区的保护。街区整体和街道是历史文化街区的重要组成部分,街区格局和街道环境与现代街区有很大不同。其内部以胡同和夹道为主,道路狭窄,胡同中的交通方式多为步行,但是由于更新和管理的问题,步行环境存在步行空间破碎,环境品质较差等问题,导致可步行性堪忧。目前历史文化街区的保护越发受到重视,北京近
学位
在我国老龄化现象严重的社会背景下,人居环境与老年人身心健康的关联性越来越受到社会各界的重视。由于老年健康是动态变化的,身体机能和周边环境发生的细微变化都有可能对老年人的健康产生长期的影响。因而作为老年人亲近自然、锻炼身体、情感交流、缓解压力的重要场所,养老设施户外空间环境的恢复性与老年人身心健康的关联性值得我们关注。然而,既有养老设施的户外空间普遍存在环境质量差、空间功能性不足、场地适应性较低等弊
学位
学位
目的:小肠腺癌是一种极其少见的恶性肿瘤,在消化道恶性肿瘤占比约为3%。由于小肠腺癌发病率低,临床数据少,目前关于小肠腺癌的治疗、预后因素研究较少。本研究收集300例小肠腺癌患者的相关资料,回顾性分析了小肠腺癌患者的临床病理特征及预后相关因素,以期为临床提供帮助。方法:收集2003年1月至2020年7月在安徽医科大学第一附属医院、安徽医科大学第二附属医院及安徽省立医院三家医院中行手术治疗的患者共30
学位
背景:子宫内膜癌(uterine corpus endometrial carcinoma,UCEC)是女性生殖系统常见的恶性肿瘤,近年来其发病率呈上升趋势,发病年龄趋向低龄化。UCEC起源于子宫内膜腺体,其中子宫内膜样腺癌(uterine endometrioid adenocarcinoma,UTEA)是其最常见的病理类型,2009年FIGO标准根据组织结构及细胞核特征将其分为3级,即高分化(
学位
目的探讨CD117在肺神经内分泌癌的病例中的表达。给临床病理诊断及治疗开拓新的方向。方法收集2014.01-2021.01在XX医院接受肺癌根治术并经病理证实为肺神经内分泌肿瘤的病例共60例。所有病例中典型类癌、非典型类癌、肺大细胞神经内分泌癌及肺小细胞癌的病例数分别是14例、10例、20例、36例。应用免疫组化En Vision法检测CD117在肺神经内分泌肿瘤组织及周围组织中的表达情况,通过卡
学位
目的:骨转移作为一种常见的肺癌远处转移,其严重影响着病人的生活质量。开展对肺癌患者发生骨转移的风险预测,对于临床医生早期发现并预防、指导治疗和延长肺癌患者的生存期具有重要意义。本研究旨在探讨导致肺癌患者发生骨转移的危险因素,同时,基于这些危险因素构建肺癌患者发生骨转移的可视化风险预测模型。方法:本研究回顾性收集了2020年1月1日至2021年9月1日首次在安徽医科大学第一附属医院住院并经病理确诊肺
学位
目的:SOCS3基因启动子的高甲基化区域已在大多数恶性肿瘤中被发现,但SOCS3甲基化与急性淋巴细胞白血病(ALL)之间的相关性却很少被研究。本研究比较分析了在不同基因甲基化程度下的ALL患儿的临床特点,并且在体外实验进一步验证了SOCS3基因甲基化对ALL细胞功能的影响。方法:本研究通过对临床资料的归纳整理,将纳入儿童分为康复对照组和研究组,BSP技术检测不同治疗阶段的急性淋巴细胞白血病患儿的S
学位
随着互联网的蓬勃发展,各种各样的APP雨后春笋般地出现在广大人民的日常生活中。几乎每一款APP中都有推荐功能,需要快速从庞大的数据库中选出符合用户需求的信息,为用户提供个性化服务。这类数据存在不规则、无序等特点,即每一位用户交互的信息数目不一样,用户间不存在排列顺序,给传统的深度学习模型带来挑战。因此,本文以物品推荐为例,从异质图神经网络的角度对个性化的推荐方法展开研究。为了解决现有推荐方法仅聚焦
学位