论文部分内容阅读
在许多真实的网络中都存在模块或社区。社区的检测是社会网络学习的重要的课题,对于我们了解社会网络的内部关系和结构,进而应用到与社会网络相关的很多领域都有重要的意义。传统的基于相似度的社区发现算法比如GN算法在计算的时候时间复杂度非常高,而基于相似度的社区发现算法的结果主要取决于相似度的选择,有些相似度选择可能使得结果更准确,但是针对规模较大的网络,时间也要是考虑的主要因素之一,所以可以根据网络的不同要求来选择相似度的不同度量方法。目前基于相似度的算法中有两个经典算法,分别是GN算法以及AP算法。GN算法中的时间复杂度非常高,针对这个弱点,可以提出一种基于扩散核特征矩阵相似度的分裂算法和一种基于DSD相似度的分裂算法。这两个算法都是基于网络拓扑结构的算法,避免了GN算法中的计算边介数的时间复杂度高的弱点。实验的结果表示,两个算法的划分效果和GN算法差不多,在效率上有很大的提高,对于相似度的度量方法的研究有一定的价值。Newman贪婪算法是近期社区发现的一个主要算法,拥有准确快速的特点,但是当社区规模过大时,可能会使得社区规模分配不均。在比较基于扩散核特征矩阵的相似度和基于DSD相似度度量方法的优缺点之后,使用DSD相似度度量算法结合Newman贪婪算法(CNM算法),既结合了CNM算法快速准确的优点,而且在一定程度上避免了CNM算法的社区规模分配不均匀的情况。