论文部分内容阅读
随着各种社交网络、个性化推荐等服务的发展,个人信息往往被服务提供者收集、管理并加以利用,由此也产生了个人信息被泄漏的风险。现有的个人信息隐私保护方法,在具有各种背景知识的攻击者面前面临着更加严峻的挑战。因此,研究和改进隐私保护方法以适应新的攻击场景具有重要意义。针对目前的隐私保护方法对已知个体相关性进行攻击的场景研究不足的问题,以一种比较常见的已知个体相关性的攻击场景为背景,设计了一种能够抵抗该攻击的隐私保护模型,即r-抗元组关系攻击隐私保护模型。为了得到该隐私保护模型,首先提取出该攻击场景的本质并抽象成已知元组关系的攻击模型,并对攻击模型中的个体间关系进行范围的界定和建模;然后给出能够抵抗该攻击模型的元组应该满足的条件即r-抗元组关系攻击性,约束匿名后的关联元组的候选敏感属性集合之间的交集大小至少为阈值r;最后根据是否包含关联元组为不同类型的分组分别施加不同程度的隐私约束,给出抗元组关系攻击隐私保护模型的定义,并从理论上证明模型的安全性。以r-抗元组关系攻击隐私保护模型为基础,设计出用于生成匿名数据集的算法,包括用于提取数据集中背景知识的敏感属性等值关系提取算法以及用于生成满足安全约束的匿名发布表的抗元组关系攻击隐私保护算法(包括分组创建算法、分组补充算法和表分割三个部分),并给出算法正确性、安全性、可用性以及代价的理论分析。实验表明,满足r-抗元组关系攻击隐私保护模型的隐私保护算法生成的匿名数据与满足?-多样性的Anatomy算法生成的匿名数据相比,两者不仅具有相近的可用性,而且前者具有更好的安全性。