论文部分内容阅读
数据隐私保护技术在现实中具有重要的作用和意义。其中,动态数据集重发布中的隐私保护在现实中得到了越来越广泛的应用,随之相应的隐私保护模型的研究也得到了进一步发展。但是,现有的动态数据集重发布中的隐私保护模型在对动态数据集进行重发布的过程中,大都存在着一些不足和缺陷。本文主要对M-Distinct模型进行分析研究。首先,M-Distinct模型虽然考虑了敏感属性的更新概率是不同的。但是,在具体实现的过程中,由于其随机的选择该类敏感属性的候选更新集中的敏感属性值,因此处理后并不能完全解决属性链接和概率攻击问题。如果攻击者在获得了连续的两个或者两个以上的匿名化版本和一些背景知识后,可能推得由任意连续发布的匿名化版本的相关QI-Group间敏感属性值的更新概率不同而可能导致隐私泄露。对此,本文为每一类敏感属性的候选更新集,建立一个辅助候选更新的候选更新集专家系统和构造相应的敏感属性值更新树,以便准确地衡量该类敏感属性的候选更新集内各个敏感属性值之间的更新概率和更新关系,可能导致属性链接和概率攻击的敏感属性值之间利用αmax的限制使其具有相当的更新概率,以合理分配到相应的QI-Group,这样就能更好地解决由属性链接和概率攻击而导致敏感属性泄露问题。其次,M-Distinct模型对于永久敏感属性导致的隐私泄漏问题却无能为力,本文考虑不同敏感属性的价值不同,对分配到同一QI-Group内的非敏感属性值和永久敏感属性值的记录分别进行相应地处理。最后,提出了一种基于(m,αmax)-Distinct的动态数据集重发布中的隐私保护模型。仿真实验结果表明,该模型在动态数据集重发布中能够较好地解决由属性链接和概率攻击而导致的隐私泄露问题,同时也在一定程度上保证了数据的可用性。