基于差分隐私的直方图发布算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:csincis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的深入和普及使得数据的采集、存储、发布以及分析变得快捷方便。数据挖掘技术能从各类发布数据中获得有价值的信息,但同时也会造成个人信息的泄露,因此差分隐私发布技术的关键是在于保证个人隐私信息不被泄露的同时提高发布数据的可用性。差分隐私作为当前有效的隐私保护机制之一,通过向敏感数据加入噪声对查询输出结果进行随机化从而达到隐私保护的目的。差分隐私可以保证不管攻击者拥有多大的背景知识仍然无法推断出某条特定的数据记录的信息,但同时数据的统计分析结果仍然保留。目前,差分隐私已经应用于许多领域,例如直方图发布,数据挖掘,机器学习等。差分隐私通过添加噪音来保护隐私,其中隐私预算涉及到噪声添加的强度,直接影响到直方图发布的数据可用性,因此如何合理的分配隐私预算是差分隐私算法面临的一大挑战。论文以此为出发点,从实现差分隐私直方图发布的两种不同场景提出了两种新的直方图发布算法。由于交互式直方图发布算法通过数据分析者和数据拥有者之间的交互完成数据发布,每次交互都会消耗一部分的隐私预算,所以查询的数量是有限的。论文对现有的一些交互式发布算法进行了研究和分析,发现这些算法都是通过优化查询的方式来提高查询次数以及发布数据可用性,而忽略了隐私预算的分配问题。论文针对这一缺陷,提出了一种利用泊松分布概率密度函数进行隐私预算分配的交互式直方图发布算法IPPB,该算法的创新主要体现两点,首先实现了隐私预算的无穷次分配,使得查询次数不受限制,其次通过优化隐私预算分配权重,保证了前k次查询的数据可用性。现有的非交互式直方图发布算法表明先分组后加噪是提高发布直方图数据可用性的有效手段,该过程涉两次加噪过程,一次用于保护分组结构,一次用于保护直方图数据,如何分配隐私预算来平衡这两次加噪过程引入的误差,是非交互式直方图发布算法面临的挑战。针对这一问题,论文提出了一种自适应的隐私预算分配策略的直方图发布算法APB,通过分析分组前后引入的噪音误差和重构误差,建立了隐私预算分配权重的优化模型,得到最优分配权重和分组大小以及分组个数之间关系,基于优化模型和贪心分组的思想,提出了一种自适应的隐私预算分配策略,可以更好地均衡噪音误差和重构误差,提高发布数据的可用性。最后,通过在三个数据集上的实验,验证了论文提出的两个算法相比于现有的算法来说都提高了发布数据可用性。
其他文献
【正】在反复研读了喻平教授的《数学学习心理的CPFS结构理论与实践》一书后感触颇深,进一步体味到CPFS结构对学生思维能力的影响,下面笔者结合自己的教学实践,以数列教学为
做企业需要两种能力:理解与决断的能力,领导与管理的能力。前者是关于事的,后者是关于人的。在我花时间研究的企业里,无论中外,大多数企业都经历过“一个人的帝国”时期。中
期刊
目的:当前科学研究能力对于临床医生的重要性不言而喻,但是医生应如何摆正临床与科研的关系,是各类医院管理者,同时也是高等医学院校比较困惑的问题。文章希望通过了解各类医院不
目前,随着我国社会经济的不断发展,企业在管理决策方面也因此发生了相应的转变。在大数据时代背景下,企业的管理决策在本质上发生了相应的改变。在目前的企业管理过程中,也逐
由于科技的进步,人口的激增,地球蕴藏的有限的化石能源被大量消耗,环境污染急剧恶化,因此开发可再生清洁能源迫在眉睫。氢能作为一种新型清洁能源,其来源广泛,热值高,燃烧无
<正> 热射病是由热环境引起的。在目前条件下,缓和和解决暑热环境,最好的办法是把冷风引进禽舍。现今还很难实现在禽舍中安装空调设备,但可以使用成本低廉的热空气地下冷却装
河流污染问题越来越得到人们的关注,在治理河流污染过程中,底泥的污染治理是一项非常关键的环节,尤其是底泥重金属污染,是近年来河流污染治理研究的热点。本研究以湘江底泥为
在我国古代社会中,为了发展生产、增强国力,各朝各代都把增加人口作为重要的国策,统治者们采取种种措施鼓励人口的增长,以致于形成了“人口增者国必强,户籍减时国即衰的观念
食品连卷袋是日常生活中的必备品,通常采用极难降解的热塑性树脂制成,是造成白色污染的主要原因,随着食品包装不断地发展,可降解食品连卷袋成为食品包装新趋势,也是当今解决白色污染的主要手段之一。聚乳酸(别名聚丙交酯)是一种由玉米深加工制得的新型环保材料,采用玉米为原材料经发酵、聚合而成,制备过程环保无污染,降解产物主要为二氧化碳和水,不造成二次污染。相比于众多以化工原料为主的可降解热塑性树脂,聚乳酸的优
比例微分方程是延迟微分方程的一个重要分支,被广泛地应用到电动力学、非线性动力系统、自动控制、生态学、金融等许多领域,促进了社会的发展。一般来说比例微分方程的理论解不