【摘 要】
:
多方数据联合学习可以取得较好的学习效果,但数据聚合带来了安全和隐私问题,很多研究方案将安全多方计算应用到纵向联邦学习中。现有的纵向联邦学习的研究方案都是基于数据公开共享,一种是明文数据共享,另一种是密文数据共享,但都带来了安全性和效率的问题,因此在保持足够模型精度的同时提升计算效率和安全性是联邦学习研究的一大挑战。为了解决这些问题,本文提出了一种基于安全多方计算的纵向联邦学习隐私保护方法。首先,本
论文部分内容阅读
多方数据联合学习可以取得较好的学习效果,但数据聚合带来了安全和隐私问题,很多研究方案将安全多方计算应用到纵向联邦学习中。现有的纵向联邦学习的研究方案都是基于数据公开共享,一种是明文数据共享,另一种是密文数据共享,但都带来了安全性和效率的问题,因此在保持足够模型精度的同时提升计算效率和安全性是联邦学习研究的一大挑战。为了解决这些问题,本文提出了一种基于安全多方计算的纵向联邦学习隐私保护方法。首先,本文提出了一种基于安全多方计算的纵向联邦数据预处理隐私保护框架,设计了一种将隐私数据限定在数据所有方本地范围内的编码方法,该编码方法可以作为解决纵向联邦统计分析问题的基本范式。其次,本文提出了一种基于安全多方计算的纵向联邦学习决策树隐私保护框架,包括特征混洗协议与随机化梯度和协议保证各参与方数据安全。另外在保证基础精确度的同时,保护了训练中间梯度参数的隐私安全。最后,本文还实现了基于安全多方计算的纵向联邦学习隐私保护框架,实验证明本文的框架在保证安全性和基础精度的情况下,计算效率相比于现有方案有显著提升。本文的具体贡献点如下:·基于安全多方计算的纵向联邦学习数据预处理隐私保护框架:本文提出了纵向联邦学习数据预处理阶段的统计分析方法,数据提供方和数据应用方的真实数据均未出本地,保证了数据的可用不可见。(1)提出了一种卡方分箱的隐私保护方法,计算过程中无法分辨真实虚假分组,在保护参与方隐私数据同时相比于同态加密技术计算效率更高。(2)提出了一种信息值隐私保护方法。采用随机分裂的方式隐藏真实特征类别信息,使得数据所有方以外的其他参与方无法得到真实特征数据,保护数据隐私安全。(3)提出一种最大信息系数的隐私保护方法。通过网格模式将特征数据离散化得出区域矩阵,区域矩阵不包括实际特征数据信息,保护数据隐私安全。·基于安全多方计算的纵向联邦决策树隐私保护框架:本文提出一个基于安全多方计算的纵向联邦决策树隐私保护框架(MPCXGBoost),在保证基础精确度和保护各参与方数据隐私安全的同时,提升决策树预测训练的计算效率。(1)本文提出了一个特征混洗协议MixShuffle,在保护数据隐私安全的同时提升计算效率。(2)本文提出了随机化梯度和协议EGHSum,随机化梯度和解密协议DGHSum,在保证基础精确度的情况下,保护中间参数的隐私安全。·基于安全多方计算的纵向联邦学习隐私保护框架实现:本文实现了基于安全多方计算的纵向联邦学习隐私保护框架,该框架实现了数据预处理模块的卡方分箱、信息值、最大信息系数的隐私保护方法,在保证数据隐私安全的情况下支持多方进行协同数据预处理。并且该框架实现了联邦决策树MPCXGBoost隐私保护模型的预测训练,包括特征混洗协议、随机化梯度和协议、随机化梯度和解密协议,支持多方数据协同预测训练,实验表明在保证基础精确度和隐私数据安全的情况下,计算效率显著提升。
其他文献
目前国内工业品电子商务的发展还在刚起步的阶段,供工业品电商使用的高质量搜索引擎目前国内还有待研发,本系统的目的就是给工业品电商平台提供一个快速搜索工业品的系统,在满足工业品电商的业务需求后优化用户的购买体验。工业品垂直搜索引擎系统是出自上海鑫谊麟禾科技有限公司垂直搜索产品线的实际项目,属于中国传统搜索引擎行业。工业品垂直搜索引擎系统是以产品信息为基准,明确电子商务产品和其客户要求,进行针对产品的垂
工业互联网时代,制造业企业对于效能提升的需求与日俱增。在面向市场的竞争中,快速响应生产需求变更的企业往往具备更强的灵活性。车间如何在各种约束条件下,针对不断变化的生产需求快速而弹性的制定生产计划,降低库存的堆积并节省运维的各项成本实现降本增效,是一个值得研究的问题。当下,大多数企业在车间生产的过程中缺乏科学的统筹规划,未形成具备体系的排程方案。车间作业调度问题(JSSP)作为车间排程系统的核心,也
随着世界经济的蓬勃发展和我国改革开放的逐步深化,信用卡支付已成为现代社会最常用的支付方式之一。作为一种不断增长的服务,如何评估其申请人是否能偿还贷款对于正确的支持金融机构去定义其政策与策略起着关键性的作用。在过去的几十年里,人们提出了许多方法来评估个人信用风险,但是要准确地评估信用风险还存在很多待解决的问题。其中一个问题是如何充分利用现有的无标签数据,从而减少标注成本,解决这一问题的关键技术是半监
地铁隧道交通运输是现代城市轨道交通系统的重要组成部分,随着我国城市化进程的不断推进,大量的地铁隧道由建设期转为养护期,受设备使用时间,材料性能劣化、周边工程活动、气候条件等多重内外因素的影响,导致隧道衬砌结构出现大量病害,其中,衬砌裂缝是最常见最严重的一类病害,及时高效地检测出这些裂缝对于后期的维护工作意义重大。为解决传统人工检测效率低,成本高的问题,本文提出了基于深度学习的地铁隧道裂缝目标检测方
无人艇(Unmanned Surface Vehicle,USV)是一种可在复杂水面环境中自动巡航、自主执行多种任务的新型载体。随着航海领域内的国际形势变化以及大众对于民用智能化无人艇的强烈需求,如何保障无人艇在水面运动轨迹的准确性和可靠性逐渐成为研究关键技术之一。由于无人艇在自主运动中,容易受到风、浪、流等外界因素干扰,加之具有非线性运动的特点,因此研究无人艇的航迹跟踪对拓展海洋开发潜力,保障作
近几年,随着移动互联网的发展,广告业务迎来了新的变革。为了吸引更多用户,在提升项目运营收益的同时,减少广告投放的成本,广告主们希望能够实时的分析广告投放数据和项目运营数据。因此设计出一款能够结合广告投放数据和项目运营数据的实时分析系统,就是当下各大广告主不可或缺的需求。本文的基于广告投放的实时运营数据分析系统就是为了满足广告主的需求而设计开发的。系统采用埋点自动化实时数仓的解决方案,保证数据能够被
随着国家战略下新能源车的研发制造与全面推广,结合国内互联网行业的高速发展,以往传统车企中汽车营销及服务系统所采用的单体架构,其冗长的需求到最终上线周期会耗费大量时间,在面对日渐复杂的需求业务以及不断增长的业务量现状,已经无法满足当下以及未来新能源车业务生态发展的需求。本论文针对上述问题基于Spring Cloud Alibaba微服务架构和Vue web框架实现了一套全新的新能源车数字化营销及服务
随着互联网的不断发展,云计算和大数据已经成为时代的热门技术,在数据存储、数据传输、访问控制等方面产生了更加复杂的安全需求。在传统的属性基加密中,属性均由一个可信的私钥生成中心管理,存在密钥托管问题;且当用户私钥发生泄漏时,无法有效锁定私钥泄露的恶意用户身份。在目前国内外研究中,多机构授权下的属性基加密方案能够有效缓解密钥托管、避免单一授权机构权限过大的问题。在可追踪属性基加密方面,白盒可追踪模型是
在数字金融化的不断发展和普及的时代,数据量随着业务的增加呈现爆发式的增长,分布式概念越来越普及,但由于大多数传统银行核心系统使用的仍然是集中式大型主机系统,在数据扩展、系统升级和数据安全上逐渐遇到瓶颈,因此由集中式系统迁移至分布式系统势在必行。对于大型银行系统迁移任务来说,应用服务迁移、分布式路由转发和数据库迁移是系统迁移中的重要任务,本文以应用服务迁移为重点,对服务转发前的路由规则重适配、服务重
随着汽车智能化、网络化的发展趋势,汽车通过车载终端接入了互联网,更多地和云端进行交互,并为汽车用户提供了丰富的车联网和娱乐服务。近年来,车辆的电子电气架构往分布式架构发展,车内控制器的数量也急剧增加,控制器软件的迭代日益频繁,为解决软件更新带来的运维和成本问题,提供用户更便捷快速的升级服务,FOTA(Firmware Over the Air,固件在线升级)成为汽车升级的重要方式。然而,FOTA升