论文部分内容阅读
随着网络信息技术的快速发展,可收集信息的种类和数量都呈指数增长,而基于信息共享、科学研究等方面的需要,数据收集者需将收集到的数据信息进行发布。由于发布的信息中涉及到很多个人隐私信息,因而如何在发布数据的同时保证隐私信息不被泄露已经成为众多学者关注和研究的热点问题。
近年来,面向数据发布的隐私保护技术研究主要集中在基于匿名策略的限制发布技术上,该技术结合了数据扰动技术和加密技术各自的优点,是一种折中方案,但目前所提出的模型和方法主要针对单敏感属性的数据集,并不适用于多敏感属性的数据发布。本文在现有模型的基础上,研究了多敏感属性数据的静态和动态发布隐私保护技术,提出了两种多敏感属性静态发布模型和一种面向动态数据的发布模型。本文主要研究工作包括:
1.对隐私保护的相关研究现状作了分析,对现有的面向数据发布的隐私保护静态和动态模型进行了分类综述,并介绍了几种典型的匿名发布技术。
2.针对多敏感属性静态数据发布中多维桶方法的不足,以及不同应用场景中隐私保护度和数据可用性的不同要求,分别提出了一种基于多维桶技术并综合考虑敏感属性敏感度的(g,l)-分组匿名模型和一种基于相同敏感属性集的l-覆盖性聚类分组匿名模型。实验结果表明,与传统多维桶分组匿名模型相比,(g,l)-分组匿名模型能够有效地抵制相似性攻击问题,同时也能满足发布数据的可用性;l-覆盖性聚类分组模型在不隐匿记录的前提下,实现了数据的隐私保护,同时提高了发布数据的可用性。
3.针对多敏感属性动态数据发布,提出了一种基于敏感属性安全变化集的l-Inclusive分组匿名模型。利用发布数据记录的敏感属性值在时间上存在一定合理变化范围的特点,分组时通过l-Inclusive条件约束来达到保护数据记录隐私信息的目的。实验结果表明,该方法在保证发布数据的安全性的同时很好地保留了发布数据的可用性。