论文部分内容阅读
现实世界中众多的复杂系统都可以抽象的表示为复杂网络,而社区结构是复杂网络最显著的结构特征。从某种程度而言,整个网络的功能往往取决于社区间的相互作用。通过跟踪社区结构,可以在中观层面上探索网络的变化,并研究网络结构与主题的关系。与此同时,社区的演化对网络的动力学特征也产生着重要影响。因此,社区跟踪的研究不仅仅具有重要的理论意义,而且具有重要的实际应用价值,近年来吸引了计算机、社会学、数学等多学科研究人员的广泛关注,并正在成为复杂网络学科的一个研究热点。论文对已有社区跟踪方法进行了深入分析,针对这些方法中存在的问题与不足,在时域网络节点活动特性研究的基础上,提出了基于活跃节点的社区跟踪算法,并分析了DBLP网络的演化规律。本文的主要工作如下: (1)研究时域网络节点的活动。本文定义了节点活动窗口与节点活动率,用来分析节点在网络整个生命周期中的活动规律。接着,根据节点在相邻时间片的出现情况,将节点分为活跃节点与非活跃节点。同时,计算活跃节点在网络社区链接中的重要性,以及活跃节点本身的信息相似性。结果表明,活跃节点在社区平滑演化中发挥重要作用。 (2)设计实现了基于活跃点的社区跟踪算法。该方法通过两社区共有的活跃节点判断其是否存在演化关系。在不同社区之间的相似性判断中,根据两社区间规模的差异,采用不同的相似度函数,并依据共有活跃节点的规模判定社区是否相似。在DBLP数据集上,将本算法与既有社区跟踪算法进行实验对比分析,结果表明本算法可以有效地跟踪网络中的社区结构。 (3)研究DBLP合著关系网络的社区演化。本文将DBLP数据按年划分,采用平衡传播算法得到每一时间片的社区结构,并利用本文算法跟踪其社区结构,得到社区演化规律。通过研究分析数据集上六种社区演化的分布情况,本文发现社区在演化过程中较多表现出“出现”、“消失”、“扩张”三种演化形式。通过对社区的持续跟踪,发现社区寿命随着时间推移逐渐增长。最后,引入文本挖掘技术,初步追踪了网络主题演化规律,研究了社区演化与主题演变的互动情况。