基于差分隐私的分布式正则化算法

来源 :西北大学 | 被引量 : 0次 | 上传用户:lw8312188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,各个领域都收集到了海量高维的敏感数据.这些数据通常以分布式方式存储,如何从这些数据中提取有用的信息并且保护个人隐私成为了统计学、信息科学以及计算机科学等诸多领域关注的热点.现存的分布式算法并不具备保护个人隐私的能力.因此,开展具备隐私保护能力的分布式算法研究具有重要的意义.本学位论文聚焦于基于差分隐私的分布式算法研究,具体地:(1)关注分布式存储的组结构数据隐私保护问题,开展满足差分隐私的分布式组变量选择研究.首先基于交替方向乘子法(ADMM),提出分布式Logistic组变量选择算法.进一步,为了防止计算机信息交互过程中可能产生的隐私泄露,提出分布式Logistic随机响应组变量选择算法,并证明算法满足差分隐私.实验表明,所提算法可有效处理组结构分类数据并保护其隐私.(2)在给定的假设条件下,开展基于差分隐私的分布式在线学习研究.首先提出分布式在线Logistic模型,其次基于在线交替方向乘子法(OADMM)求解该模型.针对可能出现的隐私泄露问题,提出分布式在线Logistic梯度扰动算法,证明了所提算法满足差分隐私并且给出Regret界.实验结果表明,所提差分隐私算法的可有效处理分布式存储的流式分类数据并提供隐私保护.
其他文献
近年来,人工智能技术发展迅速,不仅取得了显著成果,而且已经应用到人们的日常工作和生活中。因此,掌握人工智能的有关知识显得十分必要。通过引入和翻译国外人工智能领域的相关文本,可以帮助人们更好地了解人工智能的发展历史和未来趋势。本翻译实践的原文本为Stuart Russell(斯图尔特·罗素)所著Human Compatible:Artificial Intelligence and the Prob
随着互联网技术的快速发展,越来越多的在线服务出现在日常生活中.由于传统算法耗时长、内存占用大等特点,通常无法有效地处理在线问题.如何将传统机器学习算法转化为适应快速应答的在线学习算法受到广泛研究.于此同时,已收集的数据中通常包含如医疗信息、财务信息和社交信息等的个人敏感信息,如何快速提供服务的同时保证客户隐私不被泄漏同样值得研究.从这两点出发,本学位论文聚焦于研究在线Logistic回归模型的不同
在大数据环境下,由于计算机的存储,计算能力和安全隐私等问题,传统的统计估计方法可能不再可行,因此可以利用多机器的优势对数据集进行分布式统计推断与计算.在分布式环境下,为了降低计算复杂度,本文基于拟牛顿法――BFGS算法解决了相应的分布式算法设计与统计推断问题.具体地,包括以下两部分:(1)针对通信正常的分布式环境,在较低的通信成本下,建立了快速的一般分布式BFGS算法,其关键是将步长进行分布式近似
本文围绕韩国高敞高中的汉语课堂,以该校182名汉语学习者和4名汉语教师为调查对象,结合自己的实际教学实践,通过问卷调查和访谈等研究方法,从学校的课程设置、所选教材、在校汉语学习者和汉语教师这四个方面对该校的汉语教学情况进行了调查分析。希望本研究在促进该校汉语教学发展的同时,帮助赴韩汉语教师志愿者了解CPIK项目下的韩国高中的汉语教学情况。基于高敞高中的汉语教学现状,文中首先对韩国高中的汉语教学背景
秦腔被誉为梆子戏的鼻祖。秦腔传统剧目服饰也是秦腔的重要组成部分之一。数字化时代的到来,科学技术逐步渗透在我们的日常生活中,数字化展示技术与传统服饰文化有机融合也是近年来计算机图形学的热点之一。数字化技术已经为秦腔发展指路新径,但其中关于传统剧目服饰的展示较为狭窄,实体展示仍占主导地位。秦腔传统剧目的数字化展示便为传播秦腔文化提供了可借鉴的途径。本文主要探究秦腔传统剧目服饰的数字化展示,通过秦腔传统
诺奖得主石黑一雄是当代著名的日裔英籍作家,他以细腻入微的写作风格和普世的人文关怀感召读者,广泛地书写着各国人民共通的情感旨归。他的第五部长篇小说《我辈孤雏》于2000年首次出版,故事设定在二十世纪初的上海和英格兰。主人公克里斯托弗·班克斯从小在上海生活。然而父母失踪后,他不得已离开这座城市,回归母国。双亲难寻,因此他立志成为大侦探,以期实现找寻父母、伸张正义的人生使命。目前,关于该小说的研究集中在
链路预测是图模型及网络数据分析的研究热点之一,该方法通过分析已知的网络节点及其结构等相关信息,预测复杂网络中尚未产生连边的节点对之间产生连边的可能性大小.但在链路预测过程中所使用的节点(用户属性),连边(用户关系)等隐私信息的不当使用已引起人们关注.真实网络中蕴含的隐私数据可能会导致用户真实信息泄露,给用户个人及信息发布者带来负面影响甚至经济损失,造成非常严重的结果.本文聚焦于网络链路预测的隐私保
随着科学技术的迅速发展,高维数据及海量数据的采集、存储和使用在科学研究领域发挥了越来越重要的作用.高维数据通常具有以下几种特征:第一,高维数据本质具有稀疏性,同时有组结构,数据尽管具有较高的维数,但是可能只有一小部分维数的数据以组的形式对特征起作用;第二,高维数据在现实生活中常以动态产生,每时每刻都可能有新的数据流入数据集中;第三,高维数据会包含敏感信息,人们采集的大规模数据会包含大量的个人隐私.
二十世纪中期,爱德华·帕尔默·汤普森(Edward Palmer Thompson)在《英国工人阶级的形成》中以斗争经验为切入点,展示出了工人阶级的动态形成过程,在之后发表一系列论文中,汤普森对工人阶级和工人阶级文化做了更加深入的阐述,这些最终建构起了他的工人阶级文化理论。汤普森所取得的卓越的理论成就以及其理论所产生的巨大的跨学科的影响让他被尊为马克思主义历史学研究和文化研究的一代宗师。本文围绕E
国内外学者对中国考古出土的玻璃珠进行了大量研究,业已取得了丰硕的学术成果,特别是科技考古研究者在玻璃珠成分分析方面建立了完整的研究体系,积累了丰富的数据。这些数据涉及的范围广,总体数据量大,而随着今后数据的不断累加,仅依靠传统人工的整理方法将难以达到对大量数据快速高效利用的目的,因此开发设计适合玻璃研究的专题数据库是目前开展进一步工作的基础。本项工作将有利于减少科研工作者的重复劳动,有助于高效汇集