论文部分内容阅读
随着社会网络应用的活跃用户数量不断增加,社会网络时刻影响我们的生活,这使得社会网络分析显得尤为重要。发布真实数据集对于了解网络结构,分析网络信息流动有着重要的作用。研究者和研究机构通过分析隐藏在社会网络中的信息探索网络的潜在特征。然而发布真实社会网络数据集会带来隐私安全问题,恶意攻击者根据发布的数据攻击社会网络目标用户。如何在社会网络匿名图中保证用户的隐私安全同时减少信息损失成为研究者关注的重点。社会网络用户数量急剧增长,传统的单机环境已经满足不了用户的实际需求。设计基于Pregel模型的分布式处理图数据的框架,基于大量真实社会网络数据验证算法执行效率和结果数据的可用性,实验结果表明基于k-核的分布式社会网络隐私保护方法在分布式处理图数据的同时保证数据可用性。首先,针对社会网络图中的敏感边隐私保护问题,提出基于k-核的社会网络随机扰动方法。基于Pregel模型并行处理大规模社会网络图,寻找高核邻居节点替换连接边,保证匿名前后节点核数不变,保护社区结构稳定。通过随机扰动限制攻击者正确识别节点之间连接边的概率。然后,针对随机扰动算法对图结构破坏的问题,提出一种基于k-核的敏感区随机扰动方法。将萤火虫算法应用于社会网络中,基于Pregel模型并行寻找高影响力节点,将低影响力节点聚集在高影响力节点周围形成敏感区,以k-core、degree、PageRank算法作为萤火虫算法节点初始化影响力值,得到不同影响力的节点,最终根据不同的边保留概率在敏感区随机扰动保护隐私安全。最后,针对现有的匿名算法忽略匿名前后节点影响力问题,提出一种基于k-核的社会网络节点分裂匿名方法。分解社会网络图得到k-核图,基于Pregel模型并行分裂节点匿名社会网络的同时保证原节点的核数不变,保证节点影响力不变。为了进一步提高算法的匿名保护强度并保证社区结构稳定,针对社区结构提出保护社区中节点影响力的社会网络匿名算法。