论文部分内容阅读
复杂网络的研究已经成为现代许多科学分支的一个共同焦点问题,而连边预测是复杂网络中最重要和最有兴趣的问题之一。连边预测是基于网络已知的连边结构信息以及节点的属性来预测两个节点之间产生连边的可能性。连边预测不仅包括了对未知连接(存在但尚未发现的连边)的预测而且包括了对未来连接(有可能出现在未来的连边)的预测,该问题的研究在理论和应用上有着重要的意义和价值。
结构最简单的连边预测方法是基于算法的相似性指标,该指标主要分为三类:局部相似性指标,全局相似性指标,类局部相似性指标。公共邻居(Common Neighbor),Adamic-Adar指标,资源分配指标(Resource Allocation index)在局部相似性指标中表现最好。本文对上述三个局部相似性指标进行改进,在这三个指标原有定义的基础上进行邻域扩充,我们不仅考虑两个节点一步长度的邻居,而且考虑两个节点两步长度邻居的信息。不同网络拓扑结构信息不同,我们通过改变参数来调节不同邻域交的权重,以达到最佳的预测效果。通过一些真实网络数据实验表明,此方法相对于局部路径指标(Local Path index),Katz指标,LHN2指标,以及局部相似性指标,有着更精确的预测效果。该方法既准确又稳健,而且有着较快的计算速度。特别对于大型稀疏网络,此方法能大幅度地提高预测精确度,而且在计算速度上有着绝对的优势。数据实验结果也表明少数网络的最优邻域交权重参数值为负数,我们通过k-shell方法分析此类网络的核结构,发现此类网络有一个相对稳健的核,核内连接高度紧密。此类网络中包含了一些干扰信息,我们通过一个负的邻域交权重参数来削减这些干扰信息,从而达到最佳的预测效果。
富人俱乐部是复杂网络中的一种特殊现象,一些度较大的节点(富节点)相对于度小的节点往往更趋向于紧密联系在一起,从而形成一个俱乐部。判断富人俱乐部现象的方法比较多,往往需要与大量度分布相同的随机模型进行对比,过程比较繁琐。作为改进相似性指标的应用,本文通过找到调节邻域交权重的最优参数值,如果最优参数值为负数,可以判断该网络有着较明显的富人俱乐部现象,该方法比较直观而且过程简单,有着很好的效果。