论文部分内容阅读
近年来,随着复杂网络数量的不断增多,复杂网络所涉及的领域不断扩大,对复杂网络性质的研究已经成为一门非常热门的课题。复杂网络通常具有一定的社团结构,即社团内部的关系紧密而社团与社团之间的关系稀疏,对应到网络图上就是社团内部的边多而社团与社团之间的边稀少。如何快速、有效地从复杂网络中获取社团结构,是大多学者研究的主要方向,也具有重要的应用价值。本文通过查阅相关的中外文献,对现有的社团检测算法进行研究,设计了两种新的社团发现算法:基于少量选点的层次凝聚社团检测算法(HCDFSN)和基于少量选点的主动半监督社团检测算法(ASCDFSN)。HCDFSN算法介绍了一种节点相似性度量方法、核心节点度量方法以及根据相似性处理社团间重叠节点的方法。该算法的大致思想为从核心节点出发来构建新的社团,直到所有核心节点用完为止;然后处理社团间重叠的部分;最后基于模块度对初始社团合并得到最终社团结构。HCDFSN算法通过初始社团形成方法和社团边界处理方法可以解决以下两个问题:(1)层次凝聚算法中社团边界节点一旦分错,不能重新划分问题;(2)层次凝聚算法中效果不理想问题。ASCDFSN算法介绍了一种得分计算方法、候选节点获取方法以及主动半监督策略。该算法的主要思想是通过得分计算方法获取候选点集合;再从候选节点中选取一部分节点,进行人工标记;最后使用半监督思想进行社团检测。ASCDFSN算法通过得分选取策略和主动半监督策略可以解决半监督算法中以下三个问题:(1)随机选取少量节点导致社团检测效果不佳问题;(2)选点经常不能覆盖所有社团问题。本文在多个真实网络数据集和一个人工合成网络数据集上进行实验,对算法运行的过程进行可视化展示。并通过与同类型算法的实验结果对比和复杂度分析表明,HCDFSN算法和ASCDFSN算法在社团检测上有较好的效果且效率较高。