论文部分内容阅读
庞大的社会网络数据中蕴藏着大量有价值的信息。近年来大数据技术的发展使得社会网络中的用户数据被频繁地收集和分析,导致隐私泄露问题层出不穷,引起公众的不安。为了在不泄露用户隐私信息的前提下进行数据共享及分析,隐私保护技术应运而生,力求兼顾数据的可用性与隐私的安全性。现有的社会网络隐私保护方法大多着眼于模型的建立与实现,没有充分结合社会网络自身存在的一些特性比如幂律分布特性、整体性等,导致最后发布的网络整体结构受到严重破坏,影响数据的可用性。为此,本文提出了基于节点介数的k-度匿名网络构建方法,以及基于扩散小波的边权重差分隐私保护方法,分别针对社会网络中的节点度和权重矩阵进行了隐私保护。本论文的研究内容主要总结为以下两个方面:(1)建立了κ-度匿名隐私保护模型,提出了基于节点介数的k-度匿名网络构建算法,使发布的匿名化网络最大程度上保留了原始网络的核心结构。该算法用介数来衡量节点对网络拓扑连通性的贡献程度,弥补了现有的匿名网络构建方法无法复原低度数核心节点1-层子图的不足。该算法在保证隐私安全性的前提下,提高了发布网络数据的可用性。(2)针对带权无向网络的权重攻击问题,结合了扩散小波与差分隐私技术,提出了满足ε-差分隐私的隐私保护算法。该算法利用了社会网络各边之间的关联特性,将社会网络的权重矩阵转换到频域进行多尺度分析,并灵活地添加拉普拉斯噪声。该算法避免了现有面向权重攻击的差分隐私算法中直接对局部链路加噪造成的数据失真问题。实验结果表明,在相同的隐私预算下,运用本算法进行隐私保护后发布的网络具有更高的数据可用性。