联邦学习中隐私保护安全聚合机制研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:dongnoh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代发展至今,个人或企业数据的安全性、隐私性逐渐被重视,“数据可用不可见,用途可控可计量”是学术界和工业界对数据隐私的新要求。联邦学习保证各方数据不出本地私域的情况下实现联合建模,是打破数据孤岛,实现“数据不动价值动”的核心技术框架。但经过具体的学术研究和工业实践,联邦学习仍然存在一些隐私问题。首先,本地模型参数或者梯度更新可能会泄露一些原始数据集的信息,敌手可能采用重构攻击、成员推理攻击等反推数据拥有方的样本关联信息。其次,一些联邦学习方案将所有的参与方视为可信实体,多个参与方间共享模型更新或持有同一个密钥,不仅会降低实际应用场景中的适用性,也会导致安全问题和隐私泄露。因此,为了解决联邦学习中存在的隐私泄露问题,本文的主要工作如下:首先,我们梳理了联邦学习和代理重加密的国内外研究现状,然后对密码学相关基础知识做了一定阐述,同时对相关的联邦学习和代理重加密技术进行了定义及说明。其次,为了解决横向联邦学习中的安全聚合问题,设计了一种基于随机分片加密分发再全局求和的聚合方案。我们梳理了传统联邦学习模型可能面临的安全威胁,以模型参数随机分片机制为基础,保证参与方在只得到分片的情况下无法还原出分片前的本地模型参数,从而保护每个参与方的隐私信息,且可以抗共谋攻击,即使除参与方本身的其他参与方全部共谋,也不能得到真实的本地模型参数。同时,在参与方之间的通信内容是加密和签名进行的,由证书管理机构出具的证书保证信任链的完整,可以有效防止窃听攻击和内容伪造。经理论分析和证明,该方案具有正确性,且具备选择密文攻击下的安全性。在基于JPBC库的仿真中,该隐私保护方案的计算和通信开销也相对较小。接下来,为了解决上一方案不能在有用户掉线时保证聚合结果正确性的问题,提出了另一种可动态选择参与方的安全聚合方案。该方案基于代理重加密技术,由可信第三方为每一个参与方生成与本地模型参数维度相同的随机矩阵噪声,由聚合服务器在每一轮选择不同的参与方参与训练,并作为代理者进行重加密再发送给对应参与方,参与方可以在本地模型参数上传前加噪,从而保护每个参与方的隐私信息。另外,其身份信息在注册时加密提交给可信第三方,整个通信中采用加密后的身份信息密文,既可以实现身份匿名,又可以在节点作恶时恢复其身份信息明文,实现了身份信息的条件隐私。经过理论分析与仿真,该方案具备更多功能特性,且在仿真实现中具有计算高效性。
其他文献
目标跟踪技术在军用和民用领域都有很重要的研究意义,如军事领域中对敌机群的实时跟踪技术、对敌方导弹的跟踪拦截技术等,在民用领域中的无人驾驶技术、人脸识别技术等。本文主要针对目标跟踪领域中的多目标跟踪、航迹关联、航迹预测和航迹中断补全问题进行了研究,具体的研究内容如下所述:首先,研究了基于随机有限集(Random Finite Set,RFS)的多目标跟踪问题,阐述了目标运动模型和卡尔曼滤波算法,接下
学位
随着信息时代的不断发展,各类应用软件的问世给人类的日常生活带来了巨大的便利。但是随着软件需求的不断增长,软件开发的迭代次数也日益增加,在迭代过程中无法避免地会产生各式各样的缺陷。进行软件测试有可以重现和记录缺陷,进而改正缺陷,但是过度的测试工作会导致大量时间和人力成本的浪费。研究者们提出利用软件缺陷预测技术,通过软件的特征属性和缺陷数据构建预测模型来预测软件缺陷,它有助于合理分配人力和时间成本,提
学位
强大的军事实力是国家安全的坚实保障,在和平年代通常采用军事演习的方式来提升部队的作战能力,然而军事演习的成本较高,且无法重演作战方案,灵活度较低。在仿真技术不断发展的背景下,人们逐渐倾向于通过对抗仿真来进行演习,与传统的演习相比它的优势是成本低、安全以及可重复。仅需构建对抗仿真系统,即可模拟战场对抗环境,对作战过程、指挥决策过程进行仿真推演,并且能够实时地评估战场,比较各种作战方案的优劣,提高指战
学位
在现实生活中,多元时间序列数据存在于各个领域,在各行各业的分析预测中都起到了重要作用。这些研究领域涉及到了天气预测,以帮助农业种植和航空窗口预测;涉及到金融领域,以帮助股票分析和宏观政策制定等等。在过去,已经提出了很多的多元时间序列预测算法。最初应用于多元时间序列预测的方法是基于统计学的,而后随着深度学习的快速发展,很多深度学习算法也被应用到了这一领域。在众多的深度学习算法在多元时间序列预测领域的
学位
随着信息技术的日益发展,网络上的信息数据在迅猛增长的同时,也产生大量垃圾信息,导致人们无法及时有效的发现他们感兴趣的信息。推荐系统基于用户交互记录过滤无关信息,并向用户推送他感兴趣的信息,能够有效解决信息过载问题。但是传统推荐方法存在数据稀疏问题,而知识图谱能够结构化的组织和管理互联网中海量的实体信息和实体间的关系信息。因而,基于知识图谱的推荐方法成为研究热点。然而,现有使用知识图谱进行推荐的研究
学位
小样本学习期望构建一个仅训练少量带标签样本即可完成相应任务的网络模型,从而避免一般深度学习算法的大量数据收集与标记问题。细粒度图像分类意为对图像进行子类细分,由于其类内差异大而类间差异小的特点,采用传统强监督抑或弱监督的深度学习算法均成本高昂且效果不理想。而小样本学习算法无需大量样本与额外标注信息,能够在细粒度图像样本数量极少情况下,达到可观的分类性能。本文的主要工作内容如下:深入研究了现有基于度
学位
遥感图像语义分割作为重要的计算机视觉任务,其任务是在高维特征图上提取语义信息,在像素级别上对汽车、建筑、道路、树木等物体进行密集预测,常应用于地质探勘、辅助地图绘图等现实场景。在过去几年,基于CNN(Convolutional Neural Network)的遥感图像语义分割方法提升不大,其问题可以归纳如下:首先,CNN会在卷积、池化过程中丢失部分细节,导致深层特征图缺乏足够信息恢复图像信息;其次
学位
群智感知作为一种新型的物联网感知模式,能够将数以万计的零散感知设备整合成一个感知网络,并在该网络上进行大规模的感知任务,以低成本的方式实现数据的收集,在环境检测、健康医疗、交通监管、应急救险等领域发挥着重要的作用。然而,感知数据通常与个人信息相关联,任务请求者通过感知数据容易推测出个人的兴趣爱好、行为习惯等,造成严重的个人隐私泄露,影响数据收集的积极性。此外,在海量感知数据中,有相当一部分数据是重
学位
无人机的民用普及性给生产生活方式带来巨大变化,同时导致一些隐私安全问题,为实现对黑飞无人机的智能化管控与反制,急需开展对无人机目标的智能分析与监视技术研究。与可见光相比,红外传感器对光照变化不敏感,可以完成无人机长时监控任务。同时,红外图像只包含灰度信息,可以保护一些私密场景中的敏感信息。然而,远距离感知无人机红外视频图像存在复杂背景干扰、目标像素有限、特征点少等问题,相似度判别困难,导致现有算法
学位
翠绿宝石晶体是一种宽带可调谐激光晶体,具有硬度高、热导率高、抗光学损伤能力强的优异光学性质。该晶体的发射光谱位于700-900 nm之间,在超短脉冲的产生与波长调谐等方面具有极大的优势,可被广泛应用于遥感雷达、光电对抗、激光美容、激光精密加工等领域。同时,翠绿宝石晶体的吸收光谱覆盖400-700 nm,蓝光、绿光、黄光和红光波段的光源均可选作翠绿宝石激光器的泵浦源。不同波段的泵浦源有不同的优势,选
学位