组合方法在网络群体结构划分中的应用

来源 :南开大学 | 被引量 : 0次 | 上传用户:liuning2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然科学、社会学和技术领域里的许多复杂系统都可以用网络来表示,因而近年来关于网络的研究引起了各个学科学者们的极大兴趣。现实网络(real-world networks)在统计意义上的一些共有结构特性得到了广泛而深入的研究。群体结构即是这些性质中的一种,它也是本篇博士论文的主要研究对象。 群体结构反映的是网络中一些点集的如下特征:点的集合的内部连边十分密集,而集合与集合之间的连边较为稀疏。这也成为关于群体结构的一个基本的定义。群体结构的研究对于生物、科技和社会网络的结构认知均具有十分重要的意义;不仅如此,网络群体结构的挖掘还有利于对网络中的个体功能特征进行探索,因而具有重要的理论价值和广阔的应用前景。虽然关于群体结构的量化定义至今尚未在学术界达成共识,但是在上述基本定义的基础上,学者们开展了大量的工作。自2002年Girvan和Newman在《美国科学院院刊》(《PNAS》)上发表了一篇开创性的文章以来,六年间,仅是专门研究群体结构划分方法的文章即有十余篇刊登在《美国科学院院刊》和《自然》(《Nature》)杂志上;包括这些方法在内,至今已知的划分方法达到四十余种;此外,应用这些方法对各学科领域网络的群体结构进行研究的文章更是难以计数。然而,在目前已知的方法中,除了一类基于指标优化的方法(以CNM方法为代表)之外,其它方法均无法在脱离外部参数和人为干预的情况下得到自然的群体结构。这也促使我们以研发新方法为基础开展工作。 本篇论文由三个部分组成:在第一部分(第一章和第二章),我们提出了-种新的群体结构划分方法;第二部分(第三章和第四章)主要给出了该划分方法的应用;应用又大致分为两个方面:一是进行划分方法性能测试与比较,主要通过应用各种方法(含本方法)于已知结构的现实网络和人工网络来实现,二是网络群体结构挖掘,即直接针对具体网络进行群体结构分析。第三部分(第五章)探讨如何进行群体结构的比较和评估。这三个部分的研究内容也正是当前群体结构划分领域的三方面主要研究内容。 在第一章,我们回顾了群体结构划分问题的发展历程,介绍了群体结构的不同定义,并分类综述了近六年来部分有代表性的群体结构划分方法。 在第二章里,我们提出了一种群体结构划分的新方法,即LP方法,该方法基于组合优化中的线性规划理论。这是(截止相应成果发表时)在该领域中,第一种将线性规划应用于网络群体结构划分的方法,也是第一种能够不依赖于外来参数和人为干涉,独立地给出单层群体结构的方法(CNM方法给出多层群体结构)。我们的模型最终可表述为基于单个控制参数的一组线性规划问题。我们证明了该方法关于控制参数的收敛性,并确定了参数的上界,从而也证明了该方法在实际应用中的可行性。基于理论分析,我们还讨论了在实际运用中如何提高LP方法的效率。在第三章中,依照目前通行的评估方法,我们用三组测试证明了LP方法具有比当前的主流算法更好的品质。在第一组关于若干著名的现实基准网络的试验里,相对于GN算法(被认为是分析现实网络最为有效的方法之一)和计算机科学领域的图划分算法,我们的方法均得到了更优的结果。CNM方法是除LP方法外唯一能自然地给出群体结构的算法,因此我们将其与LP方法进行比较。为此我们设计了第二组测试网络,即“扰动试验网络”,并用四种指标对群体结构的结果进行了评估,结果证明我们的方法相对于CNM方法有更好的表现。第三组可信度评估测试基于一组被广泛应用的基准人工网络,即“四群组网络”。所有三组测试均表明,LP方法不仅具有理论上的创新性,而且在实际应用中对于网络群体结构的判定具有高度的准确性。 在第四章中,我们构造了一类特殊的基因网络,即GO网络。我们研究了LP方法和CNM方法对斑马鱼(Zebrafish)GO基因网络的功能模块的探知能力。我们讨论了得到的基因群体结构的生物学特性,并揭示了群体结构划分方法对于基因功能认知的重要意义。 在第五章中,我们首先介绍了现有的各种比较(对于同一个集合的)多个划分的量化指标,以及“单点转移距离”指标的已知结果。出于实际需要,我们提出了“子集转移距离”这种新指标,随后用组合分析的方法,分四个区间完整地确定了该指标的上界,并构造了达到上界的特例。上界的确定使得我们能够将该指标正则化,从而更加有效的利用这种指标。这不论是对于评估网络群体结构的结果,还是对于比较群体结构划分方法,均具有十分重要的意义。
其他文献
根据舰载灯光系统中各个CAN网络的不同通信机理,为不同的CAN网络节点设置了不同的发送ID和接收ID,确保了各类信息在CAN节点间准确、高效地传输。 According to the different
摘要:建设工程造价管理贯穿于工程建设全过程,从工程建设立项到工程决算每个环节都存在着造价管理。本文从多方面阐述了该如何搞好建设单位的工程造价管理。  关键词:建设工程 造价 管理  中图分类号:TU723.3 文献标识码:A 文章编号:   随着市场经济的不断深入,基本建设的飞速发展,原材料价格上涨,建设规模的变化,建筑工程的总造价和单位造价也在不断提高。如何合理确定和控制工程造价,使工程造价的增
期刊
曾伟的家乡丹东市是一个非常美丽的地方,山清水秀,人杰地灵,是我国著名的边境城市之一。丹东市的摄影资源也极为丰富,春有桃花红似火,更有迁鸟漫天飞,夏日荷翠映云霞,秋冬红
设(H,αH)是Hom-Hopf代数,(A,αA)是(H,αH)-Hom-双模代数,其中αH,αA均为双射.本文首先介绍了Hom-扭曲冲积的定义及其性质.其次给出了Hom-扭曲冲积形成Hom-双代数和Hom-Hopf代数的
曲线曲面造型(Curve/Surface Modeling)是计算机辅助几何设计(Computer Aided GeometricDesign,CAGD)和计算机图形学(Computer Graphics)的一项重要内容.在现行的CAD/CAM造型
目的:探讨临床基础教学中多元化教学手段的应用效果及评价.方法:选取2015级100例临床医学专业学生作为研究对象,按照随机数字表法将其分成两组,每组50例.观察组采用多元化教
消费是拉动经济增长的重要引擎。我国各地区经济发展水平不均衡,居民的收入水平不同,各地区居民消费水平参差不齐,这在一定程度上制约着区域经济的发展。为了促进不同区域经
本文第一部分提出了一类新的位置不变尾指数估计量: (γ)Mn(k0,k)={1/2Mn(2)(k0,k)}1/2+1-1/2{1-(Mn(1)(k0,k))2/Mn(2)(k0,k)}-1其中Mn(j)(k0,k):=1/k0 k0-1∑i=0{log(Xn-
压电材料和压电压磁复合材料由于其独特的力电和电磁耦合性质已经越来越被广泛的应用于工程实际中,但由于压电材料和压电压磁复合材料本身呈脆性,所以关于含缺陷的压电介质和压
Ramsey理论在组合数学中是一个很大很有趣的研究领域,它表达了很深刻的数学思想,大大拓展了鸽笼原理的内涵。Ramsey理论的结果不仅在图论和组合数学中非常重要,在数论,集合论