论文部分内容阅读
复杂网络是以网络形式对复杂系统的本质进行的一种抽象表示,能够对所表示的复杂系统进行全面、系统地描述,其中复杂系统中的个体被抽象为网络中的节点,而复杂系统中个体之间的相互关系与内在联系则被抽象为节点之间的边。对于复杂网络的拓扑特性及传播特性进行研究,有助于我们深入揭示不同复杂系统中普遍存在的特性和规律。社团结构是复杂网络中一个非常关键的结构特性,对应于复杂系统中的功能模块和结构单元,例如社交网络中的团体组织、通信网络中的用户群组、蛋白质交互网络中的蛋白质络合体等等。社团结构能够深入反映出复杂网络的组织结构和功能作用,并且对于整个复杂网络的动力学性质和信息传播特性也有着非常重要的影响,因此分析复杂网络中的社团结构是复杂网络研究领域中的一个重要课题。目前,复杂网络社团结构挖掘已经成为了国内外的热点研究课题之一,并取得了一些有价值的研究成果。然而,诸多已有的社团挖掘方法在性能上仍然有待于进一步改进。首先,大部分社团挖掘方法以模块度作为社团结构的衡量标准,但是已有研究发现模块度优化存在严重的分辨率问题,导致通过最优模块度可能无法得到合理的社团划分,从而极大地限制了社团挖掘的准确性和有效性。其次,研究表明现实世界中复杂网络的社团结构往往会存在重叠,即网络中的一些节点会同时隶属于多个社团;同时,网络中的社团往往还存在层次化结构,即一个大社团可以分裂成若干个小社团,而多个小社团则共同组成一个大社团,但是目前大多数社团挖掘方法并没有考虑网络中社团结构的重叠性和层次性,仅仅是将网络中的节点划分到不同社团中,而无法发现网络中的重叠社团结构和层次化社团结构。最后,随着信息量的爆发式增长,现实世界中复杂网络的规模不断扩大,可能包含成千上万个节点和连接,这就要求社团挖掘方法具有较低的计算复杂度,然而现有很多社团挖掘方法均无法满足低计算复杂度的要求。此外,信息传播也是复杂网络领域的一个重要研究课题,其主要针对消息、舆论、谣言等在网络中传播的动力学过程,研究在特定的网络拓扑结构下信息传播的特性、规律和机制。而复杂网络中存在的社团结构,恰恰反映了网络拓扑的分布不均匀性,因此对于整个网络的信息传播特性必然会产生相应的影响,但是目前这方面的研究尚处于初始阶段。鉴于上述,本文以复杂网络中的社团结构为研究切入点,提出了若干在复杂网络中挖掘社团结构的新方法,并且基于社团结构对于网络信息传播特性影响的分析,针对具有社团结构的网络提出了有效的信息传播最大化方法。本文的主要工作可以归纳如下:首先,本文详细介绍了复杂网络中社团结构的定义、拓扑结构和评价标准等基本理论,并进行了相应的归纳和总结。第二,针对利用模块度优化进行社团结构挖掘所存在的分辨率问题,本文将元胞学习自动机理论引入复杂网络的社团挖掘中,提出了基于元胞学习自动机的复杂网络社团挖掘方法。该方法将整个复杂网络建模成为一个元胞学习自动机,利用元胞学习自动机的演化机制,在对模块度进行优化的同时,对网络中的社团结构进行特定的拓扑约束,从而有效地避免了分辨率问题的产生。第三,对于复杂网络中存在的重叠社团结构,本文利用多目标优化的理论,提出了基于多目标优化的网络重叠社团结构的挖掘方法。首先,以网络中的边为出发点,给出了一种基于边的社团结构编码方式,使得该编码能够表示网络中的重叠社团结构。其次,给出了两个基于社团适应度的优化目标函数,能够从不同角度衡量网络中重叠社团结构的优劣程度。最后,基于重叠社团的编码方式和优化目标,将重叠社团挖掘的问题建模成为一个多目标优化问题,并通过多目标遗传算法进行求解,从而准确地发现网络中可能存在的重叠社团结构。第四,针对复杂网络中存在的层次化社团结构,本文将层次聚类和标签传播这两种技术相结合,提出了基于标签传播的网络社团层次聚类方法。该方法将网络中的特殊拓扑结构作为标签传播的种子,并利用多标签传播规则发现层次结构中的底层社团结构。在底层社团结构的基础上,再基于社团相似度进行层次聚类,从而构建出网络社团的层次化树状结构图。该方法不仅拥有良好的算法性能,还有具有接近于线性的时间复杂度,可应用于大规模的复杂网络。最后,本文以网络中的信息传播过程为出发点,针对典型的独立级联模型和线性阈值模型,分析了网络中社团结构的显著性对于信息传播特性的影响。在该分析的基础上,本文还针对信息传播最大化问题提出了基于标签传播的传播最大化方法,该方法利用网络中的标签传播过程衡量网络社团内部不同节点的中心度,将高中心度的核心节点作为信息传播的初始节点,从而有效地使信息在网络传播过程中获得较大的传播范围。