论文部分内容阅读
复杂网络是描述现实世界诸多系统的有力工具。复杂网络可以用图来表示。在图的表示中,节点代表了网络中独立的个体,边代表网络内个体之间的联系。复杂网络具有明显的社区结构,表现为社区内部节点之间连接紧密,而社区之间节点连接稀疏。社区发现为河解复杂网络的结构和功能提供了一种重要的途径。发现复杂网络中的社区不仅对于分析复杂网络的拓扑结构特征、河解复杂网络内部各个部分发挥的功能、发现复杂网络中潜在的规律以及预测复杂网络的行为等都具有十分重要的意义以及广泛的应用前景。复杂网络的拓扑结构包含了非常多的信息,然而许多传统社区发现算法在进行社区发现时只使用网络的部分结构信息,存在着信息的浪费现象。为能够把这些结构信息充分利用起来,本文分别从传统社区发现和网络表示学习的角度,将更多的网络拓扑结构信息融入到社区发现的过程中,从而提高社区发现的效果。随着社区发现领域的兴起,一大批学者投入到社区发现领域的研究中,提出了多种社区发现算法,极大地促进了该领域的快速发展。其中,标签传播算法因具备从大规模社交网络中发现社区结构的能力而受到了广泛的关注。然而,该算法采用的随机策略不仅会降低算法的效率,而且还会带来社区划分结果不稳定问题。为解决由随机策略引起的问题,本文提出了一种基于局部优化的标签传播算法。该算法引入预传播机制,根据特定因素(比如节点紧密度)对标签进行预传播以达到优化随机初始化的标签的目的。之后,根据聚合影响力的降序排列遍历并更新节点标签,实验结果充分展示了本文算法的有效性和有用性。近年来,机器学习方法在众多领域取得了突破性进展,一些学者已经尝试将有关方法应用于社区发现领域。但是每一种机器学习算法都有着各自的优缺点,哪种算法更适合社区发现仍是一个开放性问题。本文将利用机器学习算法,学习节点的特征表示,通过对节点特征表示进行聚类发现社区结构。本文通过借鉴自然语言处河领域的经典模型Word2vec,在负采样过程中引入了基于拓扑敏感的负类节点采样方法,使得到的节点表示能够更好的体现出网络的全局结构信息。得到表达能力更强的节点表示,然后根据CFDP聚类算法对节点进行聚类从而发现社区,实验结果表明了该方法的有效性。