论文部分内容阅读
社会信息网络普遍存在于现实世界中的许多领域,比如微博网络、电子邮件网络、科学合作网络等等。在现实生活中,这些网络通常以社区的形式组合在一起,社区结构具体表现为一组顶点的集合,在这个顶点集内部连接紧密而顶点集彼此之间连接比较稀疏。作为复杂社会信息网络的一个显著特征,社区结构一方面反映了目标网络个体之间联系的局部性;另一方面,社区结构影响甚至决定着发生在复杂网络上的动态过程。因此,社区结构的研究对阐明复杂信息网络的组织结构及功能具有非常重要的理论和实际意义。本文针对如何度量社区、如何发现社会信息网络中的社区结构的问题,研究了社会网络中许多高效的静态和动态社区发现算法。主要研究成果和创新之处包括:(1)基于对k均值思想以及其他相关算法的研究分析,本文提出了一种针对静态社会信息网络的社区发现算法(命名为KRRW)从社会网络中发现社区结构。KRRW采用一个简单的随机游走模型来减少k均值模型中算法对初始中心节点选择的强烈依赖程度。另外,文中还提出了一种改进的社区好坏评估方式DCD,DCD是基于社区的聚集性(clustering)这一衡量方式进行的改进,这一度量方式综合考虑了社区内及社区之间的连接密度。在一些经典的现实网络数据集上的实验结果证实了KRRW算法能够较其他一些算法获得更高的社区模块度Q,DCD以及准确率AR等衡量指标。(2)本文还针对动态社会信息网络中如何准确地挖掘社区核心顶点、如何定义和量化社区的增量变化等问题展开研究。在这些调查研究的基础上,本论文提出了一种被命名为ICDMC的新颖增量式动态社区检测算法。该算法综合考虑社区结构的历史信息和当前所产生的变化,只将在网络动态演化过程中节点交互连接有改变的节点的社区归属进行更新。在动态Zachary网络以及从DBLP抽象出的数据集上实验表明,新方法能够获得较其他算法更高的社区模块度Q以及准确率AR,在稳定度S方面也有良好的表现,这些结果验证了该算法具有较高的效率和有效性。