论文部分内容阅读
随着计算机技术的迅猛发展,越来越多的社会平台诞生,为人们服务,带来便利,人们通过社会网络相互沟通,相互了解,社会网络为人们提供了一个有吸引力的环境,能为用户提供便利的服务,拉近人们之间的距离。然而,在社会网络为用户带来便利,提供服务的同时,背后却是需要大量的用户数据支持,随着社会平台的日益完善,用户数量增长,社会平台数据库中的用户数据也同样有着爆炸性的增长。在现如今的大数据时代,越来越多的数据挖掘算法和数据挖掘工具被开发出来应用于海量数据中的知识发现,各社会平台收集的数据亦是如此,被用于挖掘隐藏在数据背后的规律,知识,为用户提供更加便利的服务,这些规律,知识往往能够帮助商业公司去做出更加合理的,科学的决策和对未来的发展趋势做预测,或者为学者提供科研方向,研究社会网络发展中潜在的知识等。但是在社会平台发布社会网络数据供政府,学者,商业公司研究时,若是不注重数据的安全性,带有恶意的攻击者获取了该数据,很容易造成社会网络中的用户隐私泄露。近年来,随着用户的隐私意识不断提高,越来越多的用户也不愿意提供个人数据给这些社会平台。对此,我们希望提出一种兼顾用户隐私和数据的可研究性的隐私保护方案,在社会平台发布数据时,既保护用户的隐私不被泄露,同时也保持社会网络数据的可研究性。本文深入研究了在简单社会网络模型下,仅关注用户本身身份的基于K度匿名的社会网络隐私保护方案,并分析了不足,同时研究了在属性-社会网络模型下,改进了K度匿名的方案,并提出了基于节点分裂的隐私保护方案。主要工作如下:1.我们提出了基于K度匿名的社会网络隐私保护方案。该方案旨在应对攻击者通过社会网络中用户节点的度来攻击社会网络中用户的具体位置,在度序列K匿名成功后,通过图修改策略修改原始网络,使得原始网络达到K匿名,并尽可能降低社会网络的信息损失。在该方案中,我们建立了简单社会网络模型,并分析了攻击者如何通过用户的度来攻击用户在社会网络中的具体位置,之后我们提出了度序列与图之间的匿名性具有统一性,度序列若是满足K匿名,则图满足K匿名,从而引出了度序列的K匿名方式,图修改策略,最终使得图达到K匿名的效果,并保证了数据的可研究性。我们采用了Facebook所发布的真实数据源对实验进行了验证,并与其它方案进行对比。实验结果表明了该方案在保护了用户隐私的同时进一步降低信息损失,信息损失低于对比方案。2.我们提出了基于节点分裂的社会网络隐私保护方案。该方案旨在应对属性-社会网络模型下,如何应对攻击者根据用户邻居集属性或者用户本身属性猜测用户隐私属性的问题。在该方案中,首先,我们通过相关文献论证了两种攻击的存在性和合理性;然后,提出了节点分裂的具体方式,以及非隐私属性与隐私属性之间相关性的计算方法;最后,我们提出了方案整体算法,并对其中部分算法进行了详细介绍。我们采用了Last.FM的开源数据集来对方案进行系统性实验,并分析了方案的隐私性,同时通过分析社会网络匿名算法的部分评价标准验证了方案,在保护了用户隐私的同时,又保持了数据的可用性。