论文部分内容阅读
复杂网络理论是人们认识世界的时候创造的一个系统性的理论,因此复杂网络可以看作是现实世界的一个抽象,对复杂网络理论的研究也一直受到自然科学界和数学界的研究人员的重点关注,其中,因为社区结构是普遍存在于其中的一个结构特性,研究社区结构发现方法对复杂网络理论发展有重大的意义,所以复杂网络中的社区结构发现算法研究一直受到了各个领域研究者的持续关注。但是该问题迄今并没有得到完美的解决,特别是对重叠社区结构的研究,给这一领域的研究带来了新的挑战。本文从复杂网络的社区结构发现的研究背景及意义出发,查看了大量的国内外相关文献,对该领域的研究现状有了大致的梳理。其次介绍了复杂网络理论的历史进程以及相关概念。再次,本文还对社区概念和社区结构发现算法的评价指标进行了探讨,并从几个代表算法出发,探讨了当前对社区发现研究的进展和不足。最后本文还重点介绍了自组织神经网络理论,从竞争学习出发,到自组织特征映射图模型,突出了自组织神经网络具有优良的拓扑结构保持和概率保持特性。针对当前重叠社区结构发现算法的不足,本文考虑到社区结构的真正组成元素不是节点而是网络中的边,提出了边的紧密团概念,并用边的紧密团来构造边向量,以期更准确的表述网络中的边所蕴含的真正信息。为了去除在社区发现过程中无用的边界边,本文基于边的紧密团概念提出了一种新的边界边的识别方法。以此为基础,本文提出了基于边向量思想的重叠社区发现算法EVKM,结合k-means算法的思想,来发现网络中的重叠社区结构。另外,考虑到神经网络优良的拓扑保持特性和概率保持特性,本文还提出了一种自组织神经网络和边向量结合的重叠社区结构发现算法SOMEV。最后,本文设计了多组实验来验证我们提出的算法的有效性,首先本文实验对比了边向量的正规化对算法运行结果的影响,然后,本文还对比了不同边归属值对社区结构发现准确率的影响,最后,我们还在人工网络和真实网络上分别对比了我们提出的算法和一些经典的社区发现算法的运行结果。通过对比实验,表明基于边向量思想的重叠社区结构识别算法在识别重叠社区结构任务中较经典算法有明显的优势,另外,自组织神经网络的拓扑保持特性和概率保持特性也有助于提高重叠社区结构发现的准确性。