差分隐私直方图发布方法的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:asdf1aasdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
差分隐私(Differential Privacy, DP)是一种新型的隐私保护模型,而直方图是差分隐私保护下数据发布的一种重要形式。在差分隐私直方图发布方法中,传统方法是采用数据转换或数据压缩技术,对原始直方图进行重新构造,同时通过添加适量噪音,对直方图桶的真实频数进行扰动,从而达到隐私保护的目的。在这一过程中,如何平衡重构误差和噪音误差是研究的关键。研究者们针对该问题提出很多重构策略来平衡重构误差和噪音误差,然而,现存的方法都没有考虑原始直方图桶的频数中存在对重构误差产生影响的离群点问题。本文主要针对上述问题对离群点进行研究,分析离群点和交替分布度对直方图重构结果的影响,并根据分析结果提出差分隐私保护下携带离群点的直方图发布方法。本文主要内容如下:(1)系统地定义离群点和交替分布度的概念,并详细分析离群点和交替分布度对重构误差的影响。(2)针对离群点导致重构误差增大的问题,提出降低交替分布度算法(Decreasing the Alternative Distribution Degree Algorithm,De-ADD)。该算法采用比较注入噪声的相邻桶频数大小的思想,对原始直方图桶的频数序列进行满足差分隐私要求的近似排序预处理,达到减小交替分布度的目的,从而减小离群点对直方图重构结果的影响。(3)提出一种基于合并桶策略的新的直方图重构算法Merge-Bins。该算法首先采用贪心的思想对直方图进行重构,每次通过指数机制选择直方图中频数最相似的两个相邻桶进行合并,重复上述过程,直到误差最小。最后,向直方图每个桶的频数中添加拉普拉斯噪声来满足差分隐私要求。(4)采用真实数据集进行对比实验。首先,根据本文提出的De-ADD算法对原始直方图结构进行预处理。然后,将未进行预处理和进行预处理的直方图通过现有的重构方法进行重构并将实验结果进行对比,以验证De-ADD算法的有效性。最后,将De-ADD算法与Merge-Bins算法组成的差分隐私保护下携带离群点的直方图发布方法(Histograms with Outliers Publishing Method under Differential Privacy, Outlier-HistoPub)与现存的差分隐私直方图发布方法进行对比实验,以验证Outlier-HistoPub方法的准确性和有效性。
其他文献
如今的社会网络,已不再是狭义上社会学研究的内容,转而成为了集尖端的科研价值与巨大的商业潜质于一体的火热研究课题,吸引着愈来愈多各领域的研究人员的关注。随着时代的发
随着互联网、计算机网络、有线电视网三网融合的脚步日益加快,数字图像、音频和视频等多媒体数字产品越来越被广泛应用于各个方面。因此著作版权的保护和信息的安全保护问题
多年来,呈指数级增长的各种信息,使得Internet用户快速获取准确必需的信息显得越发急迫。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术,用户兴趣挖掘技术
随着多媒体技术的发展以及各种数字化设备的普及,大量的图像以数字化的形式进行存储和传输。同时,互联网的快速发展,使图像的复制和分发变得更加方便快捷。如何在浩如烟海的
计算机图形学是随着计算机及其外围设备而产生和发展起来的,而随着计算机技术的飞速发展,如何逼真的模拟自然景物,成为图形学领域中最具用挑战性的研究方向之一,对于烟雾、云
集成电路特征线宽不断减小的趋势和MEMS技术制备三维微结构的要求,都需要通过采用适当的方法对电子束光刻技术中由电子的散射引起的邻近效应进行补偿,以获得足够的图形精度,
虚拟实验是根据现代教育理念的需求而产生的,具有智能指导和教学管理的作用。随着虚拟现实技术的发展和教学模式的不断变革,目前化学实验教学的要求和现有的化学实验中由于客
虚拟手术仿真系统是一个模拟医生进行手术过程的虚拟现实应用系统。它通过模拟手术过程中可能出现的各种情况,使医务工作者能够在虚拟的场景内练习手术操作并学习如何应付手
软件复用是软件工作者探讨发现的一条解决“软件危机”的新的软件开发模式,是提高软件生产效率和软件质量的一种切实可行的途径。它被认为是软件开发真正走向产业化和工程化
随着Internet的飞速发展,万维网(WWW,WorldWideWeb)得到了很大的发展。WWW系统和数据库是网络化信息服务的基础,Web技术和数据库技术相结合成为当前研究的热点,其中关键就是Web