论文部分内容阅读
随着互联网普及率的提升,各种社交App发展日益成熟,网络用户人数不断增加。截止至2019年2月,据统计我国用户目前使用最广泛的社交软件——微信的安装率已经达85.8%,每月活跃的用户数量将近10亿,平均每日活跃用户数量达到6.48亿。研究者对大规模社会网络有向图的社区结构进行分析,在相似群体发现、群体行为模式发现等方面具有重要研究意义。实际社会网络有向图中往往涉及用户的个人隐私信息,攻击者通过背景知识,能够很容易地识别出社会网络的目标用户,从而导致个人信息的泄露。针对现有社会网络隐私保护技术在处理大规模社会网络有向图数据时存在性能低、匿名数据发布不满足社区结构分析需求的问题,提出大规模社会网络K-出入度匿名方法。基于层次社区结构算法划分社区,采用贪心算法分组并匿名K-出入度序列,分布并行添加虚拟节点实现K-出入度匿名;基于GraphX传递节点间信息,根据层次社区熵的变化情况合并删除虚拟节点对,减少信息损失。然后,进一步针对社会网络中用户的不同需求,扩展所提出的K出入度匿名算法,提出大规模个性化社会网络K-出入度匿名方法。将用户的需求设置为Lv0~Lv3四个隐私保护等级,对大规模社会网络有向图进行个性化K-出入度匿名。最后,针对大规模动态社会网络有向图,提出保护社区结构的大规模动态社会网络K-出入度匿名方法。根据动态分组匿名规则对动态K-出入度序列匿名,分布并行添加虚拟节点构造匿名图;基于GraphX传递节点间信息,根据有向图模块度变化情况合并删除虚拟节点对,减少信息损失。本课题在真实社会网络有向图数据集上对提出的三种匿名方法进行实验测试与分析。实验结果表明,方法提高了大规模社会网络有向图数据的匿名处理效率,保证了数据发布时对于社区结构分析的高可用性,满足了不同用户的对于隐私保护的不同需求,同时还实现了对动态社会网络有向图数据的隐私保护。