论文部分内容阅读
随着互联网技术的不断发展,社会网络无时无刻不在产生海量数据。海量数据为科研人员提供数据分析与知识挖掘便利的同时,随之而来用户的隐私也暴露无疑。而针对社会网络数据的隐私保护问题,已经成为数据隐私研究领域学者普遍关注的热点问题。社会网络数据中的隐私信息异常广泛,攻击者可以利用多种背景知识来进行隐私攻击。目前社会网络隐私保护技术主要针对无权重的简单图,不能直接应用于加权社会网络。针对以上问题,重点研究了面向加权社会网络的隐私保护技术。分析了加权社会网络中的路径隐私泄露问题,针对最短路径识别,提出了基于加权图简单路径集和复杂路径集的不同隐私保护策略。对于简单路径集,提出了Global_Generalization算法,即对加权图目标结点之间的简单路径集进行泛化,泛化过程使得路径集中的每条路径权重取值范围相同,达到匿名路径集的目的,又使得泛化区间包含真实权重取值,从而提高匿名数据的可用性。对于复杂路径集,提出了Local_Optimization算法,即在全局泛化的基础上,对路径集中的重叠边进行局部优化处理。进而,提出了加权图k-可能路径匿名(简称KPPA)隐私保护模型,来防止基于加权社会网络的最短路径隐私攻击。针对加权图中结点敏感标签信息泄露问题,提出了k-histogram-inverse-l-diversity(简称KH-inv-LD)隐私保护模型,该模型对加权图的结点权重序列进行保护,同时基于标签信息泛化提出了反转l-多样性来防止结点敏感信息的泄露。针对k-histogram权重匿名组中的结点单敏感属性,设计了Single-sensitive-attribute generalization(SSAG)算法。研究了如何在提高数据可用性的同时对多敏感属性信息进行保护,设计了Multi-sensitive-attribute generalization(MSAG)算法。在真实数据集上进行了大量的测试研究,通过实验结果本身及对实验结果的分析,证明了本文提出的算法都能够高效地保护加权图中的隐私信息,同时基于匿名图进行采样可以无偏地恢复原图结构性质,有效地提高了匿名数据的可用性。