论文部分内容阅读
复杂网络是建模和分析复杂系统的有效工具,在理解复杂行为中起到关键作用。链路预测作为复杂网络的研究热点之一,主要解决连边存在与否的问题。链路预测可以帮助我们更好的理解复杂网络的结构特性和演化规律,同时在各行各业也有着广泛的应用场景。当前,学者们从不同角度不同层次出发,探索网络中连边的形成机制,提出了大量链路预测方法,但是目前链路预测技术还存在以下局限:(1)现实世界中存在大量的有向网络,而当前链路预测的研究主要集中在无向网络,针对有向网络特点的预测算法较少。(2)网络模体是复杂网络中的重要拓扑结构,如何从模体角度刻画节点间的相似度,如何量化模体在相似度计算中的作用等还有待研究。针对以上问题,本课题依托国家自然科学基金项目,重点开展基于模体的有向网络链路预测方法研究。本文以模体作为切入点,分别从三阶模体、四阶模体、混合模体三个方面研究有向网络的链路预测问题。主要研究内容和创新点如下:1.提出了一种基于三阶模体的有向网络链路预测方法。该算法针对有向网络和无向网络三阶子图的结构差异,应用势理论对三阶模体进行筛选,通过统计分析不同三阶模体闭合的可能性,以网络整体闭合指数作为权重计算节点间的相似性。在9个真实数据集上的实验表明,所提出的方法预测效果更好。2.提出了一种基于四阶模体的有向网络链路预测方法。面对众多的四阶子图,本文提出了限定条件,对四阶子图进行筛选,而后使用z-score方法进一步衡量四阶子图的重要程度。最终从199个子图中选出2个显著模体用于相似性计算。此外,模体的局部信息被用来进一步提高预测效果。在真实数据集上的实验表明,新提出的方法与基准方法相比,预测结果有所提高。3.提出了一种基于混合模体的有向网络链路预测方法。首先讨论了特殊四阶模体与三阶模体在相似性计算上的关系,然后探讨了无向网络中相似性方法与模体方法的关联,最后介绍了模体连通度的概念,提出了一种基于混合模体的预测方法。通过在9个真实数据集上的实验,表明了混合模体方法的预测效果好于经典方法,同时也优于三阶和四阶模体方法。