论文部分内容阅读
复杂网络大量存在于现实世界中,而在这些网络中,往往存在某些结点之间的关系比较密切同时某些结点之间的关系相对稀疏的现象,这些关系紧密的结点之间形成被称为社区的子结构。 在复杂网络中,某些结点可能不是仅仅属于其中的某一个社区而是可能同时属于多个社区,即网络中存在社区重叠现象。此外,绝大多数的复杂网络的结构不是固定不变的,而是随着时间的演进而不断变化的。随着时间的推进,网络中的结点可能出现或者消失,加入或者离开某一社区,或者是从一个社区转移到另外一个社区。结点之间的联系可能越来越错综复杂或者越来越简单。 复杂网络中的重叠社区发现和动态特性研究具有很强的现实意义。在现有的社区发现算法中,已经存在一些社区重叠发现算法和动态网络中的社区发现算法,但是同时考虑网络的动态性和社区的重叠性的算法还比较少。本文针对以上不足,提出了一种动态网络中社区重叠的发现算法,并依此对复杂网络的动态性和社区重叠性进行研究。本文主要工作如下: 针对传统算法中所采用的对图中结点进行聚类的方法不能很好地解决发现社区重叠现象与发现网络层次组织结构之间的冲突的问题,本文采用了对图中的边进行聚类的方法,提出了一种新的衡量边与边之间相似度的定义,以发现网络中的边社区结构。 本文采用改进的层次聚类算法来自然地反映复杂网络中社区的层次结构。在根据边相似度对相似的边进行合并形成新边时,为了能够进行下一步的合并,本文对合并后产生的新边进行了新的定义。 为了追踪动态网络中社区的演化过程,本文采用了时间窗口的概念,并将新定义的边相似度和改进的层次聚类算法应用于时间窗口上,以相对平滑地跟踪社区的演化过程。 本文采用动态网络数据集进行实验,验证了以上新的边相似度定义的合理性,改进的层次聚类算法的有效性,以及在引入边社区和时间窗口的概念以后,追踪动态网络社区演化过程的准确性和相对平滑性。