论文部分内容阅读
近年来,随着互联网和计算机技术的快速发展,以社会关系网络、生物信息网络、语义Web网络等为代表的复杂网络迅速兴起,复杂网络的相关研究也得到了学术界和工业界的广泛关注。社团是复杂网络的重要特性,代表着网络中具有一定关系对象的集合。社团内部的节点之间连接紧密,不同社团节点之间连接相对稀疏。通过对复杂网络中社团结构的研究,可以得出复杂网络的功能、拓扑结构和性质等信息,这对于了解网络结构,充分发挥网络价值都很重要。社团检测就是利用复杂网络中已知的节点属性信息、节点连接关系信息以及拓扑结构信息等来发现网络中特定群体的潜在规律,进而挖掘其潜在价值。当前大部分的社团检测算法都是基于网络拓扑结构展开的,这类算法普遍存在着准确率低、时间复杂度高及聚类因素单一等不足。标签传播算法是常见的基于网络拓扑的社团检测算法,具有快速、简单、高效的特点,但也存在随机性、准确性和鲁棒性的不足。针对上述问题,本文综合考虑节点属性信息以及图的拓扑结构信息,提出了两种新的改进的基于标签传播的社团检测算法。首先,基于节点归属度的标签传播社团检测算法。该算法首先从未被分类的节点中选择一个度数最大且聚类系数符合条件的节点及其邻居节点作为初始社团,然后根据节点归属度吸引它的邻居节点加入,形成大致社团结构,最后运用标签传播算法思想进行完善,得出最终的社团结构。基于节点归属度的标签传播社团检测算法适用于中小规模网络,时间复杂度低,且能够准确的检测出复杂网络中的社团结构。其次,针对上述方法在顶点数量多,边数密集的复杂网络中社团检测准确性不足的情况,提出了基于节点相异性的标签传播社团检测算法。该算法首先通过节点度数、节点聚类系数和节点相异性进行核心点集合选取,然后从核心点集合中选择核心点,根据节点相似性公式,将符合条件的邻居节点加入到相应社团,形成大致社团结构,最后根据多数投票原则修改节点标签,以获得最后准确的社团结构。基于节点相异性的标签传播社团检测算法充分考虑了各节点间的直接联系和间接联系,使社团的检测效果更加完善,准确性得到了进一步的提升。最后,针对上述社团检测方法,本文运用大量实验进行了验证。通过对检测出的社团结构的有效性和社团检测的执行效率进行测试,充分验证了本文社团检测方法的可行性和优越性。