数据发布中隐私保护关键技术的研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:wujie1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今信息技术朝着电子化与网络化的趋势发展,人们的个人信息被南规模地收集与共享,隐私泄漏正日益成为一个重要的信息安全问题。在数据发布领域,隐私数据完全是对外公开的,任何人都可以访问。如何保护发布数据中的个人隐私信息不被攻击者恶意获取,同时又使数据接收者充分利用数据信息进行有效的探索和科学研究,这是一项亟待解决的问题。本文正是在这样的背景下,对数据发布中以泛化为代表的隐私保护技术进行研究。具体工作和创新点如下:(1)介绍现有匿名策略与匿名算法的理论方法和实现技术,分析各种方法自身存在的问题,并就一些新的研究问题进行探讨。(2)提出了基于属性泛化层自修正的泛化算法RIncognito,该算法是对经典算法Incognito的改进。通过考察原始表中属性值的频数分布,按尽量合并小频数值的原则对属性域作划分,形成更合理的泛化层,从而减少泛化过程中不必要的泛化,提高发布数据的精确度。实验证明,原始数据在经过RIncognito匿名后,精确度得到提高。(3)提出了新的数据隐私度和精确度的度量方法。鉴于泛化数据的隐私度目前还没有具体的度量标准,提出了一种定量测算数据隐私度的度量方法——平均泄露概率比;同时归纳整理现有的各种数据精确度度量,并提出基于信息论相关理论的泛化数据精确度度量——加权属性熵,用来表示模糊值给出信息量的多少。最后由实验表明隐私度和精确度之间的关系。(4)设计与实现了自主研发的安全数据库系统NHSecure的数据发布子模块,引入采用k-匿名策略的隐私保护机制,实现原始数据的泛化与发布,并以实例表明隐私保护机制增强了发布的安全性。
其他文献
随着计算机网络的发展和网络的开放性、共享性及互连程度的扩大,因特网日益成为信息交换的主要手段,与此同时,一些网络新业务的不断兴起,如电子商务(Electronic Commerce)、
对词语之间和词对之间的关系进行量化测度是自然语言处理的重要研究内容之一,相关研究成果在信息检索、语义消歧、机器翻译等自然语言处理领域都有广泛的应用。近年来,词语之
现代流程工业的一个重要特点是向大型化和综合自动化方向发展。流程工业综合自动化通过集成过程控制,经营管理,计划调度和市场销售等技术手段,实现全局,局部各级优化,以最短
虚拟现实场景的仿真是虚拟现实领域的基础工作。海浪场景是虚拟现实场景中较为复杂的场景之一。首先,海浪的形状复杂,不能由简单几何体构造,在使用基本几何图元构造时需要大
学位
支持向量机主要应用于分类和回归问题中,是继神经网络后机器学习的研究热点之一。西气东输管材力学性能检测分析对质量控制起着非常重要的作用。本课题将支持向量机用于西气东
随着产品电子代码(EPC)以及物联网的概念的提出,RFID对人们生活的影响也越来越大。EPC给予每个产品一个唯一的身份标示,EPC标准体系的提出,使得RFID的开放式大规模应用具备了
分布估计算法(Estimation of distribution aigorithm,EDA)是一种基于概率模型的进化算法,它通过从当前群体中选取部分优质解作为产生新解的依据,利用概率分布模型分析这些解
拒绝服务攻击(Denial of Service,DoS)由于易实施、危害严重且难以防御,已成为目前互联网面临的最严重的威胁之一。而由其演进而来的分布式拒绝服务攻击(Distributed Denial of Se
近年来,灰色文献呈指数级增长趋势,涉及领域广泛,而且反映的是最前沿的信息,因此,各个国家,科研单位,高校都加强了对灰色文献的管理。就目前而言,灰色文献主要指学位论文、会