论文部分内容阅读
随着人们对个人隐私保护意识的不断增强,个人数据的隐私保护已成为信息安全的一个重要研究方向。未经处理的原始数据中通常含有个体的某些隐私信息,它们的发布和共享会对个体的隐私构成威胁。例如,医院的病历数据就包含了特定的病人患有某种疾病的隐私信息。
实施数据隐私保护主要是解决以下两个方面的问题:(1)如何保证所发布的数据不泄露隐私;(2)如何在实施隐私保护的同时提供良好的数据可用性。即如何在保护数据隐私的同时获得良好的数据可用性。
本文从隐私保护模型和隐私保护技术两个方面对数据发布中基于数据分解及条件函数依赖的隐私保护问题进行了研究,本文的研究内容主要有:
(1)针对泛化和排列技术无法在保证低信息损失的前提下同时保护存在性隐私和关联性隐私的局限,提出一种基于数据分解的隐私保护技术:MixBasedonAnatomy(MBOA),并基于MBOA技术提出隐私保护模型(a,l)-多样性。首先在MBOA技术中量化地定义存在性隐私和关联性隐私,阐明了MBOA技术是如何保护存在性隐私和关联性隐私的,并从理论上证明MBOA技术比泛化技术具有更小的信息损失度。此外,基于隐私保护技术MBOA提出隐私保护模型(a,l)-多样性,给出MBOA技术与(a,l)-多样性之间的关系。接着设计了一个用来构造满足(a,l)-多样性模型的MBOA模式的算法,理论分析和实验表明该模型既能同时保护存在性隐私和关联性隐私,又具有较好的数据可用性。
(2)针对现有的隐私保护模型无法解决包含条件函数依赖的数据在发布过程中的隐私泄露问题的局限,提出一种基于条件函数依赖的隐私保护模型。待发布的数据中往往都存在条件函数依赖,若条件函数依赖这个背景知识被攻击者所利用可能会引起隐私泄露。因此,本文提出一种隐私保护模型l-deduction来解决基于条件函数依赖的隐私泄露问题。首先形式化地定义了基于条件函数依赖的隐私攻击;然后建立了l-deduction模型,并设计了算法来实现l-deduction模型。理论分析及实验结果表明,该模型既能保护包含条件函数依赖的数据在发布过程中的隐私,同时又具有较好的数据可用性。