基于概率图模型的高维数据差分隐私发布

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:Mr_Sunfox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的高速发展,大量用户数据生成并被积累,成为备受瞩目的资源,如今许多热门应用都是基于用户数据的个性化、智能化服务,因此针对高维数据使用中的隐私保护成为研究热点。差分隐私凭借其可以抵御背景无关知识攻击和可量化隐私保护水平的优点在业界得到广泛认可,成为隐私保护的一个实际标准。我们也看到,虽然差分隐私可以有效地处理简单的关系数据,但是针对复杂高维数据的差分隐私发布还存在诸多挑战。目前研究重点是在保护差分隐私的前提下,通过降低数据维数,简化属性之间的关系,使得发布数据具有可接受的准确性和可用性。本文研究高维数据差分隐私发布中的问题,将具体应用中的问题抽象为计算概率模型中变量的概率分布,提出基于概率图模型的高维数据差分隐私发布方法。针对高维数据差分隐私发布中数据空间比较稀疏、计算复杂度高,以及属性之间关系复杂和无法定向的问题,提出基于马尔可夫网的高维数据差分隐私发布的方法。具体利用概率图模型中的马尔可夫模型表示属性之间的依赖关系,然后结合图形近似推理算法计算差分隐私保护下的高维数据集的分布情况。由于实际生活中变量之间的关系存在无向和有向两种关系,使用马尔可夫网模型仅仅解决了无向关系问题,所以提出使用链图模型细化不同属性之间的复杂关系,确定属性之间的关系是相互依赖的无向关系,还是有向因果关系,然后对不同关系进行分类处理,从而进一步提高数据的准确性,扩展了算法的使用范围。在真实数据集上的一系列实验表明,本文提出的基于马尔可夫网和链图的两种概率图模型高维数据差分隐私发布方法,与其他满足差分隐私的高维数据发布方法相比,较好地保存了高维数据中的有效信息,在保证差分隐私保护的前提下,使得发布的合成数据集具有更高的可用性。
其他文献
射水法造墙技术是建造地下连续墙的一种新的施工工艺。针对该项技术特点,着重介绍了设备构成、工作原理、施工工艺及各项技术指标。江河堤防的防渗加固、地下截水墙、围堰的建
本文是“天津市农业科技进步对策研究”课题的主要子课题的研究成果,我们研究建立了天津市农业科技进步的数学模型,确立了衡量天津市农业科技进步作用的指标体系,并测算了天津市
习近平新时代新闻舆论思想具有五项基本特征,即意识形态性、鲜明党性、正能量导向性、工作创新性和全球视野性。从功能定位逻辑看,贯彻意识形态性和鲜明党性是根本任务;社会
常宽,出生在北京.父亲是中国人民解放军空政歌舞团团长兼指挥,母亲是八一电影制片厂演员.他从小就受到了严格的音乐教育,不但学习钢琴、双簧管,还系统地学习了音乐理论.他14
介绍潮州供水枢纽水情测报系统设计方案。通过对本阶段潮州供水枢纽水情测报系统的不足及问题,特别是急需扩充信息源方面的分析,从全面掌握整个韩江流域水情需求的角度进行引申、联想,提出未来韩江流域水利信息化管理的近期框架性建设布局的一些想法。
简述A/O系统处理高浓度氨氮废水的试验过程与步骤,通过采集试验数据,分析试验结果,研究A/O系统处理工艺对高浓度氨氮废水处理的可行性,确定合适的工艺参数.
金融是现代农业和农村经济发展的重要支柱,发展农村普惠金融是帮助农民获得合理金融服务的重要途径。近年来,农村金融环境有了很大改善,农村普惠金融的发展已经具备了良好的
通过研究水利工程招标投标,剖析招标人与有关部门的关系,指出其中的不规范行为,以便理顺关系,明确职责,更好地贯彻执行招标投标的有关法律法规,规范水利建筑市场.
介绍了互宫网络在大规模并行处理机中的重要地位,发展特点,分析了各种互连网络的性能,最后提出了互连网络有待开发的问题。
今年年终花红形势不容乐观,明年加薪的计划可能推延,因此可锐职业顾问提醒身处职场薪情风云的职业人士,要把握住有限的机会,审时度势,未雨绸缪,为打一场薪水保卫战做好充分的准备。  我们知道,通常到每年7月,企业会对员工的绩效做一个阶段性的总结,以此来调整对员工的培训计划和反馈,这种总结往往分明确的和隐性的两种。对明确的制度化的阶段性业绩评估,职业人需及时把握和吃“透”主管意见,借以抓住机会在下半年迅速