面向动态数据集重发布的隐私保护研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:maowangaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘和数据发布等数据应用的出现与发展,如何保护隐私数据和防止敏感信息泄露成为当前面临的重大挑战。匿名化技术由于能在保护隐私信息的同时,保证对外发布数据的真实性,适用于众多领域的应用,成为近年来隐私保护技术研究领域的热点。但是,大多数现有的匿名发布研究都是基于静态数据集进行的,即假设需要匿名化的数据集不存在任何更新,且只需要发布一次。最近,人们开始关注如何对具有外部更新的动态数据集进行匿名化:当数据集存在旧数据删除和新数据插入这样的更新时,如何对其匿名化和发布。但是,与静态数据集相比,动态数据集的匿名化面临着更多挑战:1)由于动态数据集会随着时间的推移不断发生变化,因此常常需要在不同时刻对数据集进行匿名化和重发布:2)在实际应用中,动态数据集除了具有外部更新,还存在内部更新,即数据集所包含记录的属性值会动态更新。本文对同时包含外部更新和内部更新的完全动态数据集的匿名化进行了研究。本文以典型的现有匿名化方法为例,对已有方法不能对完全动态数据集进行安全匿名化进行了探讨。除了对动态数据集以及各种更新行为进行了正式定义和理论分析外,本文还首先提出了通用的、适用于所有匿名化重发布问题的隐私揭露框架和揭露风险评估理论。针对完全动态数据集的匿名化问题,本文提出了一个基于泛化的匿名化重发布原则m-Distinct。遵循m-Distinct原则的匿名重发布,能在发布真实有效数据的同时,保证隐私信息的安全。本文还设计了一个实现m-Distinct原则的算法。基于真实数据集的实验表明,本文所提出的匿名化原则和算法是有效和安全的。
其他文献
研究医学图像对促进医学科学的发展具有重大意义,图像分割是研究医学图像的核心问题。现今,已有学者将支持向量机应用于图像分割处理中,并能够取得较好的分割效果。但由于没有考
随着虚拟现实技术不断发展,三维地形可视化的构建在各个领域都有着广泛应用。三维地形的构建由过去的小规模构建,演变成了大规模动态地形的构建。对三维地形的模拟不再拘泥于
近年来,随着软件与硬件的飞速发展以及个人电脑和互联网的普及,基于熟人关系的网络如微信、基于同学关系的网络如人人网和基于关注关系的网络如微博等各类在线社交平台深受人
随着信息化的普及,计算机已走进了千家万户,为人们的生活带来了极大的便利。然而,在使用计算机的过程中,也会由于各种原因导致重要文件被删除或遭到破坏,造成无法挽回的损失
随着网络技术的发展和数据库应用领域的不断扩大,政府、企业、个人根据需要在互联网上发布自己的数据,而一些研究部门则研究他们发布的数据。在这些数据中包含了社会中各种各
网络流量是由不同应用类型的流量成分混合而成的,充分理解总体流量的构成以及各种成分的变化规律对网络管理和网络行为学研究具有重要意义。源宿IP、源宿端口与协议在五个维
随着互联网的发展和全球经济一体化,电子商务的建设变得非常重要。近年来,网络的迅猛发展给人们生活各个方面带来很大的便利,也使得企业向着信息化的方向发展。同时,企业的需求也
Web挖掘是将传统数据挖掘与Web结合起来的技术,其中Web使用挖掘的挖掘对象是用户和网络交互过程中抽取的Web日志数据。对这些数据挖掘可以帮助理解用户的行为,从而改进站点的
随着移动通信迅猛发展,手机已成为集通讯、报纸、广播、电视及电脑优势于一身的移动通信终端设备。MTK平台因其开发门槛低、开发周期短、功能集成度高而成为国内生产手机的主
随着信息化社会的不断发展,计算模式已由传统的桌面计算逐渐转变为普适计算。在这个信息空间与物理空间高度融合的环境中,用户可以随时随地、透明地享受普适环境中提供的各种