隐私数据发布下的集合型数据匿名化保护方法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:everywherecsu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
收集由政府、企业和个人产生的数字化信息,为以知识和信息为基础的决策创造了巨大的机会。在互惠互利的带动下,有需求的各方之间可进行数据交流和发布。然而,在其原来形式的数据中通常包含敏感的个人信息,公布这些数据会侵犯个人隐私。集合型数据发布下的隐私保护是一个重要并富有挑战的难题。大多数现有的技术使用泛化和整体性删除方法,而我们提出了一种部分(局部)删除方法对集合型数据进行匿名化。该方法保证无论攻击者拥有多少数目的先验知识,匿名化后数据中不再出现关于敏感信息的强关联规则。该方法不仅大幅降低了信息损失,同时可根据下游使用场景要求,提供倾向保持原始数据分布或保护可挖掘的有用的关联规则的选择。初步评估显示,我们的方法相比于经典的方法:在保持原始数据分布上优于其它方法100倍以上,保留了更多数目的可挖掘有用的关联规则并只引入了少数虚假的规则,同时信息的损失平均减少了30%左右。
其他文献
电动汽车以节能、清洁无污染而备受人们关注。作为电动汽车重要组成部分之一的电池管理系统一直是业内研究的热点问题。如何准确预测动力电池的荷电状态是电池管理系统的关键
1998年,Tim Berners-Lee提出了语义Web的概念,目标是通过向数据中添加机器可理解的语义和启发式的使用元数据来实现机器自动处理信息,数据的清楚语义加上领域理论(即本体)将使得
在当今的网络监控、电信数据管理、传感器数据监控等应用中,数据采取的是多维的、连续的、快速的、随时间变化的流式数据的形式,对数据的访问也是多次和连续的,并要求即时的
网格是建立在互联网之上的新一代基础设施,是继Internet之后又一次重大的科技进步。网格的目标是实现异构资源共享,及用来解决大规模计算或数据密集型计算等问题。 网格资
新兴的多媒体社交网络(Multimedia Social Network, MSN)服务与工具为用户之间数字内容(如电子书、数字图像、音视频等)的分享提供了便利。多媒体社交网络平台显著地改善和丰富了
本文对SIP协议的VOIP网关的实现进行了研究。文章介绍了语音通信的现状和VOIP技术的概要知识;研究了VOIP相关的各项关键技术,主要有建立通信会话的信令技术、为了便于传输而产
因特网上的信息日益丰富,已经成为知识获取的一个重要来源。信息资源的丰富也使信息的检索有如大海捞针,检索到自己所需要的信息资源效率不高。对信息进行整理,提高信息检索的效
随着互联网的迅猛发展,信息呈现出爆炸式的增长,传统的文件存储方式已经不能满足系统对于存储空间和处理时间的要求。高性能的分布式文件系统成为相关领域的研究热点。  Fast
虚拟企业是建立在现代科学技术水平基础之上的新型竞争性组织,能对激烈的市场竞争做出及时响应,是一种新的企业发展组织形式。从生产经营角度出发,制造企业可视为由多个相互
随着网络技术的发展和嵌入式设备上应用需求的不断变化,通用的层次协议栈往往不能满足。本文指出通信系统实现中采用基于构件的软件工程的有效性,给出了构件化协议体系结构:将协