发布数据的隐私保护技术研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:qq243129435
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息技术的高速发展,大量个人信息被政府部门、商业机构等存储、发布。数据发布作为信息共享的一种手段,在为数据交换和数据共享提供便利的同时,也对个人隐私带来了威胁。虽然数据发布机构会采取措施隐藏发布数据中的个人身份标识,但是通过在多个公开的数据源间进行连接操作往往会导致意想不到的隐私信息泄漏问题。K-匿名模型可以保护隐私数据不受链接攻击,能够有效地解决身份泄漏问题,但其对敏感属性泄露没有相应的保护机制,现有的其它隐私保护技术也没有考虑敏感属性的敏感度问题。论文对当前数据发布过程中的匿名化技术进行分析、研究,提出了一种新的匿名方案及算法,主要研究内容及贡献如下:针对现有数据发布隐私保护技术在匿名化过程中没有考虑敏感属性敏感度的问题,结合实际应用中对不同敏感度的敏感属性应该给予不同保护强度的实际需求,提出了一种基于敏感属性敏感度分组的(p,a)-Sensitive K-匿名隐私保护模型。该方法首先根据敏感属性的敏感度进行分组,然后给各敏感组设置不同的组约束。实验结果表明该方法可以明显地减少数据发布过程中的隐私泄漏,增强了数据发布的安全性。通过分析当前匿名泛化算法的不足,将聚类分析的思想引入到(p,a)-Sensitive K-匿名模型中,将K-匿名问题转化为K成员聚类问题,把聚类中的距离计算方法应用到(p,a)-Sensitive K-匿名模型中来计算元组之间的距离,使每个类中的元组尽可能的相似,并给出相应的距离定义和信息损失计算公式以及聚类泛化算法,对算法进行了正确性及复杂度分析,并通过实验进行了验证。针对现有泛化策略灵活性差、信息损失较大、并且存在过度泛化的问题,论文对准标识符属性的不同类型采用了不同的泛化策略,并在聚类过程中综合考察匿名化处理带来的信息损失,使用了更为灵活的数据泛化策略。实验结果表明,与传统方法相比,该方法能够有效减少数据匿名化处理所带来的信息损失。最后,分析了论文研究工作中还存在的几点不足以及需要改进的地方,给出了论文的下一步工作方向。
其他文献
随着互联网的飞速发展和用户单机处理能力的不断增强,P2P流媒体不仅彻底革新了人们对传统媒体的观念,还深刻改变了人们生活、工作和娱乐方式。于此同时,P2P流媒体也成为计算
WEB日志挖掘的主要目标是从WEB的访问记录中抽取感兴趣的模式,通过分析这些挖掘结果可以帮助理解用户的行为,从而改进站点的结构或为用户提供个性化的服务。在WEB数据挖掘领
随着互联网的飞速发展,流媒体技术正越来越得到普遍的应用,越来越多的人们选择从互联网上获得视频点播、网络电视等服务。网络视频作为越来越被认可的媒体表现形式,市场价值
不同需求类型的互联网应用快速发展扩大了对底层互联网硬件设施的需求。由于搭建硬件设施成本高,虚拟网络服务提供商将基础硬件设施网络和用户请求的资源网络分别抽象成物理
二十一世纪是互联网的时代,“互联网+教育”使学生们的学习方式发生了变化,由传统的实体课堂转移到网络课堂,从老师面对面解惑答疑到上网搜索解题资料。学生今后不光采用集中
无线传感器网络有着广阔的应用前景,作为传感器网络关键技术的路由协议也成为研究的热点之一。由于无线传感器网络应用环境和传感器节点能量有限的特点,路由协议设计的首要目
互联网上随处可见的数字图像和视频引发了人们对数字图像的关注,对图像质量评价领域的关注和研究也呈加速发展的态势。近几年随着生物学家对人眼视觉系统(Human Visual Syste
链路聚合技术,又叫链路捆绑技术,目前已被广泛地应用在一些网络连接中。通过将多条链路捆绑在一起提高了网络系统的带宽,并且为网络系统提供了高可用性,负载分担等功能。1999
随着社会生产力的发展,人们的活动形式日益广泛和多样化,地图服务的形式也随之不断进步,从传统的纸质地图到电子地图和网络地图。但是目前的地图服务形式主要以固定终端方式
本文针对一个C/C++程序静态安全检查工具,设计与实现了其中的数据流分析器,该数据流分析器为安全检查工具收集安全检查时需要的数据流信息。本文首先阐述了数据流分析的基础