基于节点结构互联性的图聚类算法研究

来源 :山西大学 | 被引量 : 3次 | 上传用户:bianyuantuifei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络团体结构是现实世界中复杂网络最普遍和最重要的拓扑属性之一。具有团体内节点相互连接紧密,而团体间相互连接稀疏的特点。揭示复杂网络的团体结构对分析网络拓扑结构、理解其功能、发现其隐含模式、预测其行为都具有十分重要的理论意义和应用价值,在科学研究、计算机科学、社会、生物和万维网等领域中具有广泛应用。图是网络结构建模的主要方法。它将现实世界网络中的实体映射为图的节点,实体间的关系映射为图的边。为了探测和发现大规模网络中的团体结构,人们将图作为其理论模型提出了众多图聚类方法。本文阐述了图聚类方法研究的背景、意义、国内外研究现状以及目前所面临的主要问题,给出了复杂网络团体结构发现方法研究的一般框架,概括性地分析比较了目前具有代表性的发现网络团体结构的图聚类方法的主要优缺点,提出了两种全新的适合不同网络规模的图聚类算法,通过在真实数据集上的验证与检验发现,其聚类效果较其他同类算法有显著提高。论文的主要贡献如下:1.本文给出了复杂社会网络团体结构发现方法研究的一般框架模型。该模型包括网络结构建模、节点相似度定义与计算、聚类算法设计、实验验证与聚类结果分析与评价五个连续步骤。2.引入了结构互联度的概念用以反映节点间的连接强度。相邻节点的结构互连度正比于其公共邻接节点的数目,非相邻节点的结构互联度定义为其间所有各最短路径上的邻接节点对的结构互联度的乘积中的最大者。基于上述定义并结合凝聚方法的基本思想,本文提出了一种新的网络图凝聚聚类方法。使用该方法在若干真实网络数据集上的测试分析表明其精度良好。3.受Girvan-Newman分裂算法思想的启发,引入了边连接系数的概念,提出了基于边连接系数的思想来发现团体结构的分裂聚类算法。该方法的算法复杂度为O(m~2),其中m为网络图的边数,聚类速度明显优于同类GN算法和基于GN算法的一些变种算法,适用于大型复杂网络的快速聚类。在将该方法运用于真实数据集的聚类实验中,取得了令人满意的结果。4.提出了一种优化的初始聚类中心节点的选取方法。该方法在运用最大最小方法求取初始聚类中心节点时同时考虑中心节点间的结构互联度和节点度数两个因素,理论上它比仅考虑距离等单一因素的聚类中心选取方法更具合理性。实际测试表明:这种方法求取的初始聚类中心点比较均匀的分布于不同聚类区块中,从而为提高聚类算法的精度和收敛速度奠定基础。5.设计和实现了上述各算法,并将其应用于空手道俱乐部关系网络(Zachary’s karate club),美国大学足球赛网络(American College football),海豚家族关系网络(Dolphin social network),美国政治性书籍构成的关系网络(Books about US politics)等来自真实世界的网络聚类分析基准测试数据集。实验表明,本文所提出的算法无论在聚类精度和速度还是团体结构模块度分析上都较同类算法有较大的提升。
其他文献
目的 :探讨子宫内膜异位症 (EM)患者的腹腔液对自然杀伤 (NK )细胞的作用 ,以及与腹腔液中白细胞介素 6 (IL -6 )、前列腺素 (PG)含量的关系。方法 :以 He L a细胞作为靶细胞
以GIS/RS为技术手段,从景观结构因子、河流及道路密度、湿度指数、地貌条件、耕地生产力5方面对东北地区湿地恢复潜力进行空间分析,确定了东北地区湿地恢复的优先、次优先区
研究不同基质配比对3个品种风信子生长与开花的影响,结果表明:泥炭与园土等量配比是最佳栽培基质。在此基质中,风信子出苗更早、更整齐、植株更高;叶片更长、更宽、叶面积更
中国美学讲究深刻地体味事物内在意蕴和作者内心情感,强调“意”,与西方古典美学中的模仿说根本不同。中国美学的这一审美观念早在《周易》中就已萌芽。本文从历时的角度,于
介绍了芳樟醇型芳樟及其他含有芳樟醇的天然植物,天然芳樟醇的提取分离方法以及天然芳樟醇在香精香料和医疗保健等方面的应用,并讨论了天然芳樟醇的一些优良性能,为天然芳樟
利用灰色系统预测模型,预测云南省2015年能源需求总量约为13813.53万吨标准煤,地区生产总值大概在15482.0979亿元;再利用云南有碳与无碳能源发展作为约束条件,以碳排放量最小
航空发动机设计性能的提高推进了热喷涂技术向更深的领域发展,热喷涂技术每次取得突破性的进展,必将促进航空发动机事业快速向前发展。
随着经济全球化的趋势不断深入,市场竞争越来越激烈,竞争方式也由企业间的竞争转向供应链间的竞争。供应链集成是近年来由供应链管理衍生而来的一个日趋成熟的崭新领域,企业
通假字与古今字是在语言的发展和使用中形成的,其各自的侧重点不同。他们共时与历时的交叉使得二者区分有些复杂,加上古书的注解中用的术语含混,区分比较困难。要使通假字和
通过简述大黄的功效及药理作用,归纳总结大黄作为我国传统中药在消化系统、泌尿系统、脑血管系统等临床各系统中的广泛应用。