论文部分内容阅读
目前,社会网络领域存在着大量的与个体或集体息息相关的信息,如:客户购物网络、朋友网络、电话网络和学术合作网络,以及各种群体网络都含有不少的隐私信息。随着计算机技术、网络通讯技术的快速发展,社会网络站点的数量越来越多,越来越多的人参与到社会网络活动。这些社会网络表现出来的关系可用于趋势分析、市场预测、疾病预测等研究,具有重要的价值。但是,这些社会网络包含个体或者集体的各种隐私信息,当我们在交流或者共享信息时,有可能会对个体或集体的隐私构成一定的威胁。因此,社会网络发布中隐私保护问题的研究具有非常重要的意义。由于随机化匿名方法是一种安全、有效的方法,使得该方法成为目前社会网络随机化领域的研究热点。随机化匿名方法通过删除原始社会网络中的边或添加原始社会网络中不存在的边来阻止攻击者唯一识别个体或集体隐私信息和敏感信息,从而实现对个体或集体隐私的保护。本文从随机化匿名方法及算法两个方面研究社会网络发布中的隐私保护问题。主要工作有:(1)现有基于谱约束的随机化匿名社会网络扰动方法只采用4个点的扰动技术扰动后社会网络的隐私保护程度不强。为此,本文基于邻接矩阵及无符号拉普拉斯矩阵,提出随机化匿名社会网络多点扰动方法,在随机化过程中将社会网络的谱半径控制在一定约束范围内,从而在保证扰动后社会网络可用性的同时,提高其隐私保护程度。扰动算法和实验结果证明,该方法能更好地保护社会网络的隐私。(2)为了更好的保护社会网络的隐私的安全性,保证扰动后社会网络的可用性,本文在上面的基础上,引进了社会网络的特征显著性(非随机化性),提出了多约束的多点扰动社会网络的方法。由于社会网络特征显著性比其他性质更能反映出它的结构性质,该方法把特征显著性作为约束条件之一,所以能有效的保护社会网络的结构性质。同时分析了该方法的安全性更好,并给出了相应的实现算法。最后通过实验比较随机化后社会网络的调和平均最短距离、传递系数和特征显著性结构性质的变化情况,表明该方法能有效地保护社会网络的隐私和提高它的可用性。