基于节点结构互联性的图聚类算法研究

来源 :山西大学 | 被引量 : 3次 | 上传用户：bianyuantuifei

【摘要】

：

网络团体结构是现实世界中复杂网络最普遍和最重要的拓扑属性之一。具有团体内节点相互连接紧密,而团体间相互连接稀疏的特点。揭示复杂网络的团体结构对分析网络拓扑结构、

【作者】

：

贾宗维

【出处】

：

山西大学

【发表日期】

：

2009年01期

【关键词】

：

复杂网络图聚类团体结构结构互联边连接系数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

网络团体结构是现实世界中复杂网络最普遍和最重要的拓扑属性之一。具有团体内节点相互连接紧密,而团体间相互连接稀疏的特点。揭示复杂网络的团体结构对分析网络拓扑结构、理解其功能、发现其隐含模式、预测其行为都具有十分重要的理论意义和应用价值,在科学研究、计算机科学、社会、生物和万维网等领域中具有广泛应用。图是网络结构建模的主要方法。它将现实世界网络中的实体映射为图的节点,实体间的关系映射为图的边。为了探测和发现大规模网络中的团体结构,人们将图作为其理论模型提出了众多图聚类方法。本文阐述了图聚类方法研究的背景、意义、国内外研究现状以及目前所面临的主要问题,给出了复杂网络团体结构发现方法研究的一般框架,概括性地分析比较了目前具有代表性的发现网络团体结构的图聚类方法的主要优缺点,提出了两种全新的适合不同网络规模的图聚类算法,通过在真实数据集上的验证与检验发现,其聚类效果较其他同类算法有显著提高。论文的主要贡献如下:1.本文给出了复杂社会网络团体结构发现方法研究的一般框架模型。该模型包括网络结构建模、节点相似度定义与计算、聚类算法设计、实验验证与聚类结果分析与评价五个连续步骤。2.引入了结构互联度的概念用以反映节点间的连接强度。相邻节点的结构互连度正比于其公共邻接节点的数目,非相邻节点的结构互联度定义为其间所有各最短路径上的邻接节点对的结构互联度的乘积中的最大者。基于上述定义并结合凝聚方法的基本思想,本文提出了一种新的网络图凝聚聚类方法。使用该方法在若干真实网络数据集上的测试分析表明其精度良好。3.受Girvan-Newman分裂算法思想的启发,引入了边连接系数的概念,提出了基于边连接系数的思想来发现团体结构的分裂聚类算法。该方法的算法复杂度为O(m~2),其中m为网络图的边数,聚类速度明显优于同类GN算法和基于GN算法的一些变种算法,适用于大型复杂网络的快速聚类。在将该方法运用于真实数据集的聚类实验中,取得了令人满意的结果。4.提出了一种优化的初始聚类中心节点的选取方法。该方法在运用最大最小方法求取初始聚类中心节点时同时考虑中心节点间的结构互联度和节点度数两个因素,理论上它比仅考虑距离等单一因素的聚类中心选取方法更具合理性。实际测试表明:这种方法求取的初始聚类中心点比较均匀的分布于不同聚类区块中,从而为提高聚类算法的精度和收敛速度奠定基础。5.设计和实现了上述各算法,并将其应用于空手道俱乐部关系网络(Zachary’s karate club),美国大学足球赛网络(American College football),海豚家族关系网络(Dolphin social network),美国政治性书籍构成的关系网络(Books about US politics)等来自真实世界的网络聚类分析基准测试数据集。实验表明,本文所提出的算法无论在聚类精度和速度还是团体结构模块度分析上都较同类算法有较大的提升。

其他文献

子宫内膜异位症患者腹腔液对正常NK细胞活性的抑制及相关因素分析

目的 :探讨子宫内膜异位症 (EM)患者的腹腔液对自然杀伤 (NK )细胞的作用 ,以及与腹腔液中白细胞介素 6 (IL -6 )、前列腺素 (PG)含量的关系。方法 :以 He L a细胞作为靶细胞

期刊

子宫内膜异位症杀伤细胞天然前列腺素白细胞介素6

基于空间分析的东北地区湿地优先恢复

以GIS/RS为技术手段,从景观结构因子、河流及道路密度、湿度指数、地貌条件、耕地生产力5方面对东北地区湿地恢复潜力进行空间分析,确定了东北地区湿地恢复的优先、次优先区

期刊

湿地恢复恢复效果评价景观格局中国东北地区

栽培基质对风信子生长与开花的影响

研究不同基质配比对3个品种风信子生长与开花的影响,结果表明:泥炭与园土等量配比是最佳栽培基质。在此基质中,风信子出苗更早、更整齐、植株更高;叶片更长、更宽、叶面积更

期刊

风信子栽培基质生长开花

从“言不尽意”到“无言之美”——《周易》对中国传统美学的影响

中国美学讲究深刻地体味事物内在意蕴和作者内心情感,强调“意”,与西方古典美学中的模仿说根本不同。中国美学的这一审美观念早在《周易》中就已萌芽。本文从历时的角度,于

期刊

周易审美言象意

天然芳樟醇资源及其开发利用

介绍了芳樟醇型芳樟及其他含有芳樟醇的天然植物,天然芳樟醇的提取分离方法以及天然芳樟醇在香精香料和医疗保健等方面的应用,并讨论了天然芳樟醇的一些优良性能,为天然芳樟

期刊

芳樟天然芳樟醇资源利用香料

云南省2015年碳排放约束下的能源结构研究

利用灰色系统预测模型,预测云南省2015年能源需求总量约为13813.53万吨标准煤,地区生产总值大概在15482.0979亿元;再利用云南有碳与无碳能源发展作为约束条件,以碳排放量最小

期刊

能源二氧化碳排放灰色系统预测模型能源结构优化

热喷涂涂层在航空发动机上的应用及发展

航空发动机设计性能的提高推进了热喷涂技术向更深的领域发展,热喷涂技术每次取得突破性的进展,必将促进航空发动机事业快速向前发展。

期刊

热喷涂工艺电弧喷涂封严圈热障涂层火焰喷涂发动机热喷涂涂层应用及发展

供应链集成对计算机通信行业财务绩效的影响

随着经济全球化的趋势不断深入,市场竞争越来越激烈,竞争方式也由企业间的竞争转向供应链间的竞争。供应链集成是近年来由供应链管理衍生而来的一个日趋成熟的崭新领域,企业

学位

供应链管理供应链集成财务绩效计算机通信行业

古今字和通假字的区分

通假字与古今字是在语言的发展和使用中形成的,其各自的侧重点不同。他们共时与历时的交叉使得二者区分有些复杂,加上古书的注解中用的术语含混,区分比较困难。要使通假字和

期刊

通假字古今字共时历时义项

浅谈大黄的药理及临床应用

通过简述大黄的功效及药理作用,归纳总结大黄作为我国传统中药在消化系统、泌尿系统、脑血管系统等临床各系统中的广泛应用。

期刊

大黄药理作用临床应用

基于节点结构互联性的图聚类算法研究

其他学术论文