论文部分内容阅读
在大数据时代,需要亟待处理的数据形式日渐增多。在关系型数据中,可将个体抽象为节点,个体的联系映射为节点的边,组织成具有社区结构的复杂网络。在复杂网络中,处于某一个社区中的个体可能来自实际网络中具有相似特点或相同生活背景的社会团体。若能有效的挖掘网络中隐藏的社区结构,则可以寻找到社区内部与社区之间的重要信息。社区发现算法的本质则是用以揭示网络中存在的社区。实际场景中,如个性化推荐系统,流行疾病的传播都是在社区发现的基础之上实现的。因此,社区发现算法具有着重要的研究意义和广泛的应用前景,也是数据挖掘领域的热点研究内容之一。各种规模的网络中存在着异构性、复杂性,使得发现社区算法划分社区结构工作变的更具有挑战性。目前诸多社区发现算法已经被广泛地应用于挖掘网络社区问题,但其获取高质量社区结构与提高算法划分社区的准确度,一直是社区发现算法不断被研究和改进的方向。本文针对复杂网络社区发现,主要做了如下工作:(1)为得到高质量的社区结构,提出了一种离散的随机漂移粒子群优化模块度(DRDPSO-net)算法。在初始时,基于节点之间的邻居相似性获取粒子群体的初始值,使其发现潜在的社区结构。其次,为了能使传统的随机漂移粒子群算法能在网络数据中取得理想结果,重新定义粒子的离散更新公式。在局部搜索过程中贪婪地更新粒子的社区信息,改善局部网络结构逐渐增强全局模块度值。在不同规模大小的生成网络与真实网络中进行对比实验,表明了该算法的有效性。在不同的网络中能获得的社区结构更为理想。(2)基于DRDPSO-net社区发现算法的实验结果分析,优化最大模块度可能造成的分辨率限制问题,且算法在真实网络中划分准确率较低。为解决此问题,提出了一种多目标优化社区的mDRDPSO-net社区发现算法。通过核均值(KKM)和比率削减(RC)两个互相冲突的目标函数来控制网络中的社区规模、缓解模块度分辨率。另外,根据多目标求解策略逐步更新Pareto非劣解集,从Pareto非劣解集中可选取满足需求的目标社区结构。在各算法的对比之下,mDRDPSO-net社区发现算法可以进一步提高地网络社区划分的准确度。(3)对具有属性信息的复杂网络的社区发现进行分析,将上述的多目标优化框架基于拓扑与属性相似进一步探究社区的挖掘。通过实验结果表明,该方法也能有效地应用于Facebook-Ego网络上。