论文部分内容阅读
现实生活中存在着各种各样由复杂系统抽象而来的复杂网络,研究和分析这些网络,能够使我们对其结构和行为有更好的认识。社区结构是复杂网络中的一个重要结构特性,它对网络的运行有着重要影响。所谓社区,即一群紧密联系的个体所形成的团体,其中社区内部的联系紧密,而社区之间的联系稀疏,如QQ、微信中的朋友圈、贴吧上某个话题论坛、科学家合作网络中的合作团体以及蛋白质交互网络中构成某一功能模块的蛋白质团体等等。挖掘复杂网络中的社区结构已成为复杂网络分析中的热门研究,对理解网络结构、分析网络行为和预测网络安全都有着极为重要的意义,复杂网络中的社区发现研究已成为一个具有重要理论意义和实际应用价值的研究课题。社区发现研究发展至今已提出很多有效算法,但随着互联网和移动终端的快速发展,数据规模的几何式扩张,很多传统算法已难以有效处理大规模复杂网络。针对这一问题,本文将粒化思想引入社区发现研究,旨在通过粒化手段压缩网络结构(网络的节点和边),缩减网络规模,从而降低问题求解复杂度。在对社区发现相关理论和算法以及粒计算相关理论知识深入研究后,本文提出两种结构粒化算法:基于局部模块度的多层粒化社区发现方法(Multilayer granulation community detection method based on local modularity,MGr-LM)和基于节点相似度的自适应粒化社区发现方法(An adaptive granulation algorithm for community detection based on nodesimilarity,AGr-NS)。通过将它们应用于8个不同类型和规模的真实世界网络数据集以验证算法的可行性和有效性,并同当前流行的多个算法进行实验对比。本文的主要工作如下:1)提出基于局部模块度的多层粒化社区发现方法(MGr-LM)。本文首先研究压缩网络的结构粒化操作,包括基于局部模块度的节点粒化操作和边粒化操作。然后通过结构粒化操作对网络进行多层次粒化,形成逐层粒化、逐层抽象的多粒度超网络,其中每层超网络对应一个粒度的社区划分(一个超点代表一个社区)。最后依据所求问题选择评价最优的粒层作为最终划分结果。在公用数据集上的系列实验结果表明,该方法能快速划分不同类型和规模的网络并获得较高质量的社区结构,且在获得更真实更有意义的社区结构方面具有明显优势。2)提出基于节点相似度的自适应粒化社区发现方法(AGr-NS)。算法MGr-LM需要获取粒化过程中的全部粒层再选择最佳结果,为了改进这一过程,使算法能够自适应揭示令人满意的粒层,本文提出一种自适应的粒化方法AGr-NS。首先计算得到网络中相邻节点间的相似度;然后通过改进的结构粒化操作自适应粒化网络,并自动收敛于满意的社区粒层;最后处理该粒层上的孤立节点,将其分配到较小的邻接社区,得到最终的划分结果。其中,粒化过程以节点相似度和基于节点相似度的网络模块度为条件启发式优化,保证划分精度的同时消除了由完全基于网络模块度优化所附带的分辨率限制问题。系列实验结果表明,所提算法AGr-NS可行且有效,可直接自适应获得与算法MGr-LM所获最佳结果的相同结果或相近结果。