论文部分内容阅读
社会网络中社区结构的研究,能够为社会化推荐提供精准定位,有助于后期潜在商业价值挖掘。目前针对社区发现算法的研究已从静态网络、非重叠社区拓展到动态网络、重叠社区领域。基于标签传播思想的社区发现算法,因其简单、高效的特性能适应当前规模不断变大的社会网络,受到了关注,并得到了较好的拓展和改进。但现有改进算法依然没有很好解决因标签传播阶段和标签选择阶段采用随机策略,带来最终社区划分结果不稳定的问题。同时针对动态网络的社区发现研究,如继续沿用静态网络已有的算法对全网络重复进行社区划分,会造成耗时过大。另外,当前社会网络发布时大都去除了节点的属性,但依然有大量隐藏在网络拓扑图中的可用信息被挖掘出来,用来识别节点身份和所属的社区信息,造成用户隐私泄露。为此,本文针对上述问题做了以下工作:1、为了挖掘高质量的重叠社区结构,提出了一种融入影响力的多标签传播重叠社区发现算法。算法先选取k个桥系数最大的节点进行团扩展,得到若干个可重叠的粗糙团,进行标签初始化。标签传播阶段,采取异步更新策略,并利用桥系数产生更新序列来指导标签更新,最终提高了社区发现的质量和算法的稳定性。在常用的真实数据集和人工网络图上做对比实验,结果验证该算法有效可行。2、目前大部分的社会网络已趋于相对稳定,相邻时刻间的网络拓扑变化较小。如果重复的挖掘整个网络的社区结构,耗时太大且没有必要。本文提出动态社区发现算法,通过相邻时刻网络快照的比对获取增量信息,利用前一时刻的社区结构和边的桥系数变化来获得待调整的局部网络。对局部网络重新进行社区划分,进而得到当前时刻的社区划分结果。实验采用真实的路由网络数据集和人工生成的网络结构图验证算法有效性。3、针对动态网络中攻击者知悉目标节点不同时刻度的变化值和社区信息而构建的攻击模型,设计节点社区的隐私保护算法。通过节点的度和所属社区两个信息,对所有节点进行k-community分组,然后对每组匿名处理,这样攻击者在获悉以上背景知识的情况,无法对节点发起攻击。匿名操作时,考虑边的桥系数,优先处理不易引起社区结构发生变化的边,保证发布图的有效性。实验证明,达到了预期效果。