基于少量选点的社团检测算法研究

来源 :兰州大学 | 被引量 : 1次 | 上传用户:yjso579202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着复杂网络数量的不断增多,复杂网络所涉及的领域不断扩大,对复杂网络性质的研究已经成为一门非常热门的课题。复杂网络通常具有一定的社团结构,即社团内部的关系紧密而社团与社团之间的关系稀疏,对应到网络图上就是社团内部的边多而社团与社团之间的边稀少。如何快速、有效地从复杂网络中获取社团结构,是大多学者研究的主要方向,也具有重要的应用价值。本文通过查阅相关的中外文献,对现有的社团检测算法进行研究,设计了两种新的社团发现算法:基于少量选点的层次凝聚社团检测算法(HCDFSN)和基于少量选点的主动半监督社团检测算法(ASCDFSN)。HCDFSN算法介绍了一种节点相似性度量方法、核心节点度量方法以及根据相似性处理社团间重叠节点的方法。该算法的大致思想为从核心节点出发来构建新的社团,直到所有核心节点用完为止;然后处理社团间重叠的部分;最后基于模块度对初始社团合并得到最终社团结构。HCDFSN算法通过初始社团形成方法和社团边界处理方法可以解决以下两个问题:(1)层次凝聚算法中社团边界节点一旦分错,不能重新划分问题;(2)层次凝聚算法中效果不理想问题。ASCDFSN算法介绍了一种得分计算方法、候选节点获取方法以及主动半监督策略。该算法的主要思想是通过得分计算方法获取候选点集合;再从候选节点中选取一部分节点,进行人工标记;最后使用半监督思想进行社团检测。ASCDFSN算法通过得分选取策略和主动半监督策略可以解决半监督算法中以下三个问题:(1)随机选取少量节点导致社团检测效果不佳问题;(2)选点经常不能覆盖所有社团问题。本文在多个真实网络数据集和一个人工合成网络数据集上进行实验,对算法运行的过程进行可视化展示。并通过与同类型算法的实验结果对比和复杂度分析表明,HCDFSN算法和ASCDFSN算法在社团检测上有较好的效果且效率较高。
其他文献
DNA作为主要的遗传物质一直备受关注,纳米技术更是给人为控制和利用DNA提供了技术支持,DNA纳米技术应运而生。近几十年来,DNA纳米结构相继问世,大量的DNA三维立体结构在实验
莱维游走是当前数学物理学研究的热点之一,在生活中应用广泛并且莱维游走与生活关系密切.本文由五个章节组成.第一章,我们简要的介绍了莱维游走的发展历史,及讨论的背景,并给
本文主要考虑一类非局部扩散模型行波解的存在性与不存在性.首先介绍传染病模型以及带治疗流行性感冒模型的相关背景和本文的主要工作内容与思想方法.其次研究了带治疗流行性
拓扑绝缘体(topological insulators)是一种具有奇特量子特性的新型材料,在凝聚态物理研究方向上是一大热点。因其具有绝缘的体态和金属性的表面态的奇特电子结构而备受关注
复杂网络可视化是复杂网络研究中的重要手段。随着Web2.0时代和大数据时代的来临,作为研究对象的复杂网络的规模越来越大,人们也越来越需要对规模庞大的数据进行准确地表达和
复杂系统的扩散过程被广泛应用于物理、化学、金融等科学领域.奇异扩散过程与分数阶FOkker-Planck方程的等价性问题近年来被广泛研究,Magdziarz[23]导出了在外部势存在的情况
非一致网格上的有限差分方法在近似经典积分/导数中已经有较好的发展,但由于分数阶算子是非局部的,因此很难将其直接推广到分数阶模型中.本文介绍了一种可以在一定程度上估计
图的自同态幺半群将图论理论和半群代数理论联系起来,是代数图论研究中的一个主要课题.本文主要利用循环完全图K(7m,7)的组合结构来研究其自同态幺半群的代数结构和性质.本文
第一性原理计算方法可以模拟材料的晶体结构以及计算材料的各种物理性质,为相关材料的制备提供理论依据。本文基于密度泛函理论的平面波赝势法,对CuXSe2(X=B,Al,Ga,In,Tl)晶
由于方柱绕流在现实生活中有很多实际应用,例如水流绕过桥墩,海上钻井平台,风绕过高层建筑物等。流体流过障碍物产生交替的漩涡脱落,会在物体上形成相关的脉动力,引起结构震