论文部分内容阅读
伴随信息技术突飞猛进的发展,人类社会已进入网络时代,从交通网络到电力网络,从引文网络到社会关系网络,复杂网络已延伸到人们生活的各个领域。因此,复杂网络在小世界网络模型和无标度网络模型问世后,成为各个领域研究的热点。社区结构作为复杂网络的显著特征,如何高效地挖掘复杂网络的社区结构也成为众多学者的研究对象。诸多社区结构挖掘算法已被陆续提出,如FN,GN,SA等算法,但这些算法存在收敛速度慢,时间复杂度高,不适用于大规模复杂网络等缺点,随着2004年网络模块度概念的提出,复杂网络社区挖掘问题转化为一种优化问题,然而这种优化问题是一种完全NP问题(多项式复杂程度的非确定性问题),很难解决。遗传算法具有解决完全NP问题非常有效、不依赖于具体问题的特性,被广泛应用,可以很好地处理此问题。然而现有的基于遗传算法的复杂网络社区挖掘算法存在寻优能力不强、计算量大和收敛速度慢的缺陷。因此本文基于改进遗传算法的思想,分别提出了基于局部模块度变异算子的复杂网络社区挖掘算法,和基于最小生成树聚类交叉算子的复杂网络社区挖掘算法,并在聚类思想的基础上,引入双种群思想,提出了融合聚类和双种群思想改进遗传算法的复杂网络社区挖掘算法。本文的主要研究工作如下:(1)受弱社区定义的启发,引入了局部模块度概念,在此基础上对变异算子做了改进,提出了一种基于局部模块度变异算子的复杂网络社区挖掘算法(LMCD)。算法在变异时选择使局部模块度增加最大的结点作为它的变异值,使候选解更直接地向符合社区定义的解靠近;交叉算子采取均匀变异策略,增大了候选解空间的迁移能力。最后把该算法应用于六个真实复杂世界网络数据中,并与其他典型算法进行比较,验证了该算法的可行性和有效性。(2)为了解决未成熟收敛问题,增加种群的多样性,引入聚类思想,提出了一种基于最小生成树聚类交叉算子的复杂网络社区挖掘算法(CGACD)。该算法通过对种群做最小生成树聚类操作,产生种群划分,选择不同划分内的个体进行遗传操作,抑制早熟收敛。然而,欧氏距离或Hamming距离无法适用于复杂网络,我们针对复杂网络的特点,定义了基于相似度的归一化共用信息的距离来衡量种群中个体间的距离,而后在计算机生成复杂网络和四个真实复杂网络上做了实验,验证了算法的有效性。(3)受双种群思想的启发,在算法CGACD的基础之上,提出了一种融合聚类和双种群思想改进遗传算法的复杂网络社区挖掘算法。新算法对(2)中产生的种群划分确定主类和副类,主类在沿着解空间搜索最优解的同时,确保副类个体为主类个体的进化提供多样性,并且在种群陷入局部最优时,通过产生一部分随机解为种群重新注入多样性。为了更清晰地分析该算法,我们首先在五个基准函数优化问题上对该算法进行了性能评估,之后将该算法运用在两个真实世界复杂网络上,对算法进行了验证。