论文部分内容阅读
随着移动互联网技术和Web2.0技术的发展和成熟,以及移动智能终端快速普及,人们在社交网络中的参与度随之提高,社交网络也成为大部分人必要的生活工具。近几年社交网络中的数据急速增长,导致网络节点众多结构复杂,也使其蕴藏着大量的内在信息,有待人们去挖掘。挖掘社交网络中的社团结构能帮助我们分析网络的拓扑结构和功能,了解网络的本质,进而可以对社交网络进行控制与预测。由于社交网络中的拓扑结构在不断的演化。因此,研发聚类精度高、算法执行效率好、并且适用于大规模社交网络的社团发现算法成为国内外科研人员的研究热点。本文主要的工作有以下几点:(1)对社交网络及其相关概念和特性进行阐述,给出模型抽象后的数学表达式。对传统的社团发现算法进行综述并加以分类,详细介绍各个算法的性能和优缺点,并查阅最新的社团发现算法,在此基础上提出两种新的社团检测算法。(2)提出基于遗传和声算法的社团检测算法(GHS)。该算法针对传统基于遗传算法的社团发现算法容易陷入局部最优,算法执行效率低,时间复杂度高的缺陷。以和声算法作为框架,利用标签传播思想来产生初始和声库,使初始和声记忆库具有较好的多样性和精度;同时利用遗传算法的双路交叉和单点变异策略来产生新解,扩大算法的搜索范围来提高社团聚类精度。实验结果显示,GHS算法的聚类精度优于FN、GN、LPA和K-means谱聚类算法。(3)提出确定FCM聚类中心的自动谱聚类社团检测算法(FCMASC)。该算法针对传统谱聚类社团发现算法无法自动确定社团数量和聚类精度不高的缺点,利用特征值的最大本征间隙来确定社团的划分数量,并根据特征向量的相关性确定出初始聚类中心,采用FCM算法对特征向量进行聚类。实验结果显示FCMASC算法能够自动确定社团的数量,聚类精度明显高于K-means谱聚类算法,是一种有效地社团发现算法。