双服务器模型下保护隐私的逻辑回归训练方案研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:arile1027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
逻辑回归是机器学习中一种基本的二分类方法,在各种现实场景中有着广泛的应用。实践中,为了获得更好的分类效果,通常需要从多个来源收集大量样本来进行模型训练。这不可避免地导致训练样本中所包含的个人隐私信息的泄漏。针对这个问题,越来越多的研究开始致力于设计能够实现隐私保护的逻辑回归训练方案。目前,一些工作给出了适用于不同数据集分布场景的方案,使用这些方案可以在一定程度上保护训练过程中用户数据的隐私性。然而,一些方案由于没有对训练中的中间参数进行保护,使得方案的安全性不能得到有效地保证。另一些方案为了保证安全强度,大量使用了全同态加密、加密电路等密码技术,导致方案在通信开销和计算效率上仍然存在不足之处。针对这些问题,本文研究了双服务器模型下的隐私保护逻辑回归训练方案,主要工作如下:(1)提出了一种基于加密电路的隐私保护逻辑回归训练方案。针对现有数据集垂直分布下的隐私保护逻辑回归训练方案在安全性上的不足,通过结合加密电路和加法同态加密技术,设计了一种新的双服务器辅助计算模型下的隐私保护逻辑回归训练方案。与原有的几种方案相比,本文方案除了能够保护用户私有数据的隐私性,还可以有效保护模型迭代训练过程中的梯度和模型参数信息不被泄露,使得方案具有更高的安全性。(2)提出了一种基于秘密共享的高效隐私保护逻辑回归训练方案。现有的一些工作为了提高通用性,提出了同时适用于水平分布数据集和垂直分布数据集的隐私保护逻辑回归训练方案,但是由于大量地使用加密电路、布尔秘密共享等开销较大的密码原语,导致方案整体性能较低。为了进一步提高方案的通用性,减少计算开销,本文基于两方秘密共享技术,提出了一种新的高效的隐私保护逻辑回归训练方案,该方案能够在任意数据集分布场景下安全的训练逻辑回归模型。与现有方案相比,本文方案给出了一种新的共享数据上近似计算逻辑回归激活函数的方法。实验结果显示,与原有方法相比,本文的方法在不引入额外交互轮数的同时,较大地提高了激活函数的计算效率。
其他文献
优化问题是指在所有解空间中求取最佳解的问题,如旅行商问题、背包问题和资本预算问题等,较有代表性的经典优化算法,如梯度下降法、共轭梯度法、拉格朗日乘数法等,但是这些经典算法在解决复杂的高维问题和求解全局最优化问题等方面,存在诸多不足,难以得到较好的效果。近年来,群智能优化算法因其适用范围广、操控简单等优点受到了科研工作者的青睐。群智能优化算法启发于自然界中蚂蚁、蝙蝠、鱼群等生物群体行为机制,单个生物
学位
目的 总结慢性阻塞性肺疾病(COPD)患者雾化吸入装置规范应用的最佳证据,为患者能够正确、有效使用吸入装置提供指导,为长期开展雾化吸入实践提供循证依据。方法 计算机检索国际指南图书馆(GIN)官网、新西兰指南工作组、欧洲呼吸协会、加拿大安大略注册护士协会(RNAO)官网、英国胸科协会(BTS)、中国指南网、英国国家临床医学研究所指南库(NICE)、JBI、Cochrane Library、BMJ、
期刊
DNA结合蛋白(DBPs)和RNA结合蛋白(RBPs)在基因调控和基因表达中起着至关重要的作用,包括转录和选择性剪接。此外,大量研究表明一些蛋白与人类的疾病相关。因此,准确识别出与DNA/RNA结合的蛋白具有重要意义。由于DBPs和RBPs在生物上具有相似的功能结构,传统方法需要人工提取特征以及需要耗费很大的成本和时间,无法满足目前大规模基因组数据进行测试的需求。因此,如何有效地识别出核酸绑定蛋白
学位
当前推荐算法中数据种类丰富且表示复杂,传统的推荐算法中使用的数据分析模型和方法,对精度提升效果不理想。缺乏统一的框架对复杂数据进行建模,即便是对同一类数据,数据中蕴含的信息也无法进行分类建模。因此针对以上问题,本文提出对信息进行分类,刻画数据中蕴含的各种信息,将数据中的有效信息挖掘出来,对信息进行相应的归类和建模。本文将用户和项目的交互数据蕴含的信息按照是否可以线性获取分为显式反馈信息和隐式反馈信
学位
融资市场集资预测一直是金融领域的一个热点研究课题,如融资市场中众筹活动的集资表现预测和众筹活动集资周期的预测。融资市场类别多种多样,如教育融资和创业融资等,很多科研人员针对特定融资市场做了相关集资预测研究。在教育类融资市场中,传统的算法更多的是利用历史数据和经验方法,这些传统的实证分析方法不能有效利用到现实生活中的社交关系和融资信息,很难精确地挖掘融资市场中众筹活动的融资能力。所以本文提出基于深度
学位
人手的姿势复杂多变,极小的手势形变就包含了丰富的信息,并且同一个人做出同一种手势,动作也不尽相同,这些都加大了手势检测的难度。手势识别是人机交互的关键技术,并且在很多的领域都有重要的应用。近年来基于深度学习的手势检测与识别技术发展迅猛,但是由于手势检测与识别容易受到光线变化和手势阴影等影响,因此面临着巨大的挑战。本文针对手势检测和识别任务的问题和挑战展开了如下研究:(1)为了解决传统方法难以应对手
学位
在车载网络系统中,信息传播离不开车辆与基础设施之间的交互。然而,交互过程常常受到恶意第三方的破坏,严重时可能威胁到驾驶者的生命安全,因此保护车辆相关信息以实现安全、高效的交互非常重要。信任机构通常在车载网络中扮演关键角色,需要与多个车辆进行交互。当信任机构向多辆车发送相同的消息时,需要与每辆车协商并发送不同的密文,存在冗余加密问题。尤其是在传输大量消息时,冗余加密问题会更加严重。同时,由于冗余操作
学位
随着科技的发展,人们获取和存储照片、视频的成本变得越来越低,而照片与视频中的人脸信息往往是人们关注的重点之一。因此,探索一种有效且高效地处理海量人脸信息的算法模型具有十分重要的研究价值和意义。人脸聚类是一种挖掘未标记人脸数据的方法。然而,由于人脸数据的规模非常庞大且特征分布十分复杂,导致一些传统聚类分析算法在处理这些真实人脸数据时表现较差。最近的研究通过使用图卷积网络(GCNs,Graph Con
学位
显著目标检测是计算机视觉领域中的一个重要研究课题,旨在研究人类视觉注意机制,利用算法模拟注意机制来检测图像中的显著目标。显著目标检测不仅推动了机器学习和人工智能等领域的理论研究,也成为很多工程应用如无人驾驶、人机交互中重要的解决方案。然而在一些特殊场景下,如前景和背景相似、复杂场景等,从可见光图像中准确地分割出显著目标非常困难,因此当下很多研究者将其他模态的信息引入显著目标检测任务,即多模态显著目
学位
随着越来越多的移动设备走进人们的生活,其产生的数据每年都在急剧地增长。数据聚合作为互联网中处理数据并进行决策性计算一项重要的技术,其通过云服务器对用户数据进行收集和分析,从而做出智能决策。然而,数据的收集可能涉及到用户隐私的问题。虽然目前已提出不少隐私保护数据聚合方案,但大多数方案采用了公钥同态密码机制,此类方案不仅计算成本高,而且资源开销也大。此外,由于移动设备质量的差异,不同用户提供的数据存在
学位