论文部分内容阅读
随着网络技术快速发展,大量在线社会网络的建立和使用,越来越多的人参加到社会网络中分享和交流信息,而在这种交互过程中,就会产生大量的数据。这些数据中包含有一部分是用户不想被他人知道的,例如,患有某种疾病,而这些通常可以被认为是个人的隐私信息。为了揭露隐藏的社会模式,各种各样的社会网络分析方法和挖掘技术被使用,一些社会网络数据也被公开,人们的隐私开始受到侵犯。另外,人们也越来越认识到隐私的重要性,隐私保护的意识也逐渐增加。因此,社会网络数据发布的隐私保护成为人们关心的一个问题。由于社会网络结构的复杂性,很多信息都可以被认为是需要保护的隐私。大多数研究只能保护一种隐私。在线社会网络涉及到网络实体的隐私信息,因而网络的数据不能直接发布。在保证发布数据可用的前提下,对社会网络数据采取一定的保护措施,才能在受到攻击时不泄露实体的隐私。直接去除实体的属性进行匿名时,如果攻击者有结构背景知识,还可从网络中将实体识别出来。针对社会网络的隐私保护提出了可应用于社会网络的(α, k)-匿名方法,在进行匿名时考虑社会网络中节点和节点之间的关系,采用基于聚类的方法,对节点属性及节点之间的关系进行保护。每个聚类中的节点数至少为k个,聚类中任一敏感属性值相关的节点百分比不高于α,并且聚类过程产生的信息损失要小。可以通过设置参数来控制不同的信息损失之间的关系。理论分析与实验结果表明,基于社会网络的(α, k)-匿名方法能在信息损失尽可能小的情况下有效地保护隐私,并且能够防止节点识别与节点之间的关系的泄露。