论文部分内容阅读
自然界中存在的大量复杂系统都可以通过形形色色的网络加以描述。一个典型的网络由许多结点与连接结点的边组成的,其中结点用来代表真实系统中的不同个体,而边则用来表示个体之间的关系,往往是两个结点之间具有某种特定的关系则连一条边,反之则不连边,有边相连的两个结点在网络中被看作是相邻的。例如,神经系统可以看作大量神经细胞通过神经纤维相互连接形成的网络;计算机网络可以看作是自主工作的计算机通过通信介质如光缆,双绞线,同轴电缆等相互连接形成的网络。类似的还有电力网络,社会关系网络,科研工作者合作网络,交通网络等等。
复杂网络近年来受到来自科学与工程各个领域研究者越来越多的关注,成为近年来研究的一个热点。目前,复杂网络的研究方法包括图论,随机图,平均场等。复杂网络的研究,例如小世界网络和BA 网络等等主要集中于网络的拓扑结构,研究的问题一般包括:1)给定网络的生成过程,网络的拓扑结构特性,比如:度分布,聚集系数等会涌现什么性质?网络的拓扑结构的相变有哪些?发生相变的临界参数值是什么?2)反之,为使网络的拓扑结构具有某种性质,如何构建网络?
由于现实中的复杂系统的数据一般都是非常大的,所以通常对一个真实的复杂系统进行研究是要耗费大量的人力和物力,有时候甚至不太可行,故大部分研究真实复杂系统的文献都只是对真实系统的一个很小的子系统进行研究,但子系统的复杂性质有时候与真实的系统复杂性质是非常不同的,因此人们希望能够根据真实系统的一部分数据的研究结果推导出整个复杂系统的数据特性。近几年,国内外有些学者开始研究如何利用抽样技术对真实系统数据进行抽样,分析抽样后的子系统与原系统的数据特性的差异及变化趋势。
一方面,现有的文献只是对抽样后的子系统进行分析,看子系统与原系统的数据特性差异,并没有能通过子系统的数据特性来得出原真实系统的复杂特性,从而提高复杂网络研究的可行性和准确性。利用分析抽样后的子系统的复杂特性来做研究更加符合实际,同时也是复杂网络研究的一个前沿方向。
另一方面,复杂网络分为随机网络、小世界网络和无标度网络,不同种网络有不同的网络属性。如随机网络的度分布呈泊松分布,平均路径长度L~InN/-k较小,簇系数C<<1;小世界网络具有和随机网络一样的度分布,但是它具有较高的簇系数和较小的最短路径;而无标度网络的结点度服从幂律分布。如何根据所研究网络的具体特征采用不同的抽样方法来进行抽样,使抽样后的子系统在最大程度上符合原始系统的属性特征也是一个重要的研究课题。
针对以上讨论,本论文的研究重点是:首先,利用抽样技术对大型的复杂网络系统进行抽样,并通过分析抽样网络的性质来推导出原始复杂网络的复杂特征参数,如对平均度、平均最短路径长度以及聚类系数等作了分析研究;然后,针对不同的网络具有不同的网络特性,根据所研究的网络特征使用不同的抽样方法来对所研究的网络进行抽样。本文主要进行了以下几个方面的工作:
1. ER网络的抽样研究。主要运用随机抽样技术对生成的ER 网络进行抽样,研究样本网络与原ER 网络的内在逻辑联系,并通过对抽样网络的复杂特性的分析来推导出原ER 网络的复杂性质。
2. BA网络的抽样研究。主要根据BA 网络的特征(结点度的不均匀性),运用分层抽样技术对模拟的BA 网络进行分层抽样,比较不同的抽样方法对抽样精度的影响。并通过抽样网络的复杂特性推导出原网络的复杂特性度量参数的置信区间。
3. 根据BA网络的度分布呈现幂律分布的特性,提出一种对复杂网络的边进行抽样的边抽样算法。并对抽样所得的样本网络进行分析,研究样本网络与原BA 网络的内在逻辑联系,并通过对抽样网络的复杂特性的分析来推导出原BA 网络的复杂性质。
基于以上的研究工作和详尽的实验分析,本论文的主要贡献是:
·提出了基于简单随机抽样的ER 网络抽样ABS 算法;对样本ER 网络与原始ER 网络相对应的可靠性度量参数变化情况进行了推导并给出了一些有用的性质;
· 根据BA 网络结点度的分布性质,首次提出了基于2-8 分层的分层抽样SSBA 算法;
· 在推导样本ER 网络与原始ER 网络有关可靠性度量参数变化关系的基础上,运用Bootstrap 方法对推导出的结果建立了置信区间