论文部分内容阅读
随着web2.0技术和社会网络的快速发展,社会网络中用户信息共享不可避免会带来用户隐私安全威胁。较之于传统未加权社会网络,加权社会网络中权值属性往往携带更丰富的个体隐私信息,面向权重隐私的社会网络隐私保护已成为链接挖掘和隐私保护领域的研究热点。当前大多数面向加权社会网络的隐私保护研究集中于保护用户个体隐私安全(Individual Privacy),缺少对社会网络中多社区协同隐私(Corporate Privacy)安全保护问题的关注。此外,已有权重隐私匿名策略难以有效兼顾维持权重数据可用性和保护数据隐私安全。针对上述问题,本文对加权社会网络中用户权重隐私安全问题进行研究。论文主要工作包括: (1)结合面向权重隐私的加权社会网络数据发布应用环境下隐私保护技术特点,分析相关隐私保护模型、具体数据匿名技术及数据可用性度量标准等。 (2)针对攻击者可能借助权重背景知识造成社会网络用户敏感标识再识别问题,引入统计攻击的概念,结合Hellinger距离衡量权值序列相似度,构建面向结点权值序列的(k,λ)-similarity隐私模型,提出基于滑动窗口的数据扰动方法SWBADP,使匿名后社会网络数据具有较高的隐私保护强度和较好的挖掘可用性。进一步提出深度聚类准则,解决k-degree匿名聚簇可能造成的隐私泄露问题。 (3)针对现有研究在社区协同隐私(Corporate Privacy)安全保护方面存在的缺陷和不足,构建面向个体用户隐私和社区协同隐私的(kα,lβ)-secure社会网络隐私模型,提出基于贪心选择的加权社会网络匿名方法KLNA和KLLA,有效防止攻击者对个体用户和社区敏感标识的逆推猜测,同时维持良好的权重数据可用性。 理论分析及实验均证明,所提出权重隐私匿名策略具有良好的隐私保护强度和可扩展性。