论文部分内容阅读
如今,随着网络技术快速发展,海量的虚拟社交网络站点快速流行于人们生活中的各个领域之中,得到大众的喜爱与应用,例如:Facebook,Myspace,Twitter,Linkedin等是目前社会化网络和web2.0的风向标。由于大量在线社会网络的建立和使用,越来越多的人们参加到社会网络中。由于科学研究和实际应用的需要,数据拥有者会将社会网络数据进行公开发布,而这些社会网络中产生了大量的个人数据信息,其中一些信息是用户不愿透露的,即社会网络中的隐私。各类社交网络分析方法和数据挖掘技术被应用,导致某些社交网络中某些个体认为隐私的数据信息也被公开,对其隐私造成侵害。因此,社会网络的隐私保护是当务之急。现有的社会网络隐私保护通常是基于所有用户完全一致的隐私保护,忽略了用户之间对隐私保护的需求存在差别和攻击者拥有的背景知识多样性。针对这一问题,提出个性化隐私保护框架,根据用户不同隐私保护需求提取部分子集,共设置三种隐私保护级别:首先,简单移除节点标签;其次,为保护节点度信息,提出基于动态规划思想的k-d_sub(k-degree_subset)算法,该算法确保在此子集内的每个节点的度至少存在k-1个其他节点的度与之相等;最后,为防止敏感属性被识别将l-diversity与k-d_sub算法结合,提出k-d_l_sub(k-degree_l_subset)算法,该算法确保此子集内每个节点满足k-度匿名并且确保在同一匿名组中节点的敏感属性种类至少存在l种。最后,基于以上个性化隐私保护框架,针对目前社会网络邻域隐私保护相关研究并没有考虑对于子集的保护,并且邻域子集中的特定属性分布情况也会造成个体隐私泄露这一问题,提出了一种新的(θ, k)-匿名模型。基于k-同构思想,利用邻域组件编码技术和节点精炼方法处理候选集中的节点及其邻域子集信息,完成同构操作,其中考虑特定敏感属性分布问题,最终满足邻域子集中的每个节点都存在至少k-1个节点与其邻域同构,同时要求每个节点的属性分布在邻域子集内和在整个子集的差值不大于θ。本文通过大量不同的实验测试方案测试算法性能,理论分析和实验测试证明,实验证明,提出的个性化隐私保护框架中各个方法和(θ, k)-匿名模型的实现皆通过添加最少数量的边,降低匿名成本并且最大化数据效用,有较高的匿名质量,能有效保护社会网络中用户的隐私。