论文部分内容阅读
随着信息技术的快速发展,各种复杂网络大量涌现,对复杂网络的分析和研究已形成了一门新兴的交叉学科。作为复杂网络分析和链接挖掘的一个重要研究方向,链接预测吸引了来自不同领域学者的广泛关注。链接预测能够根据已知的节点属性、网络结构等信息预测网络中未知的链接以及未来可能出现的链接,因此,无论是在帮助人们认识和理解网络的结构与演化机制等理论方面,还是在产品推荐、指导生物实验等应用方面都有重要的研究价值。
本文研究复杂网络中基于节点结构相似性的链接预测方法,基于相似性的链接预测方法认为,相似性越高的节点间越可能出现链接。研究发现,节点的相似性受到共同邻居、社团结构、链接权重等许多因素的影响。本文针对不同类型的复杂网络,结合共同邻居、社团结构、链接权重等网络结构特征对基于结构相似性的链接预测方法进行了深入的研究,主要包括以下四个方面:
1.在无权网络的链接预测问题上,受网络的三角形增长机制的启发,提出了一个新的基于三角形结构的相似性预测方法(TRA)。与CAR和CCLP等方法中用到的三角形不同,本文定义了一个新的三角形结构,它能够更准确的评估种子节点与共同邻居之间的亲密程度。在计算节点间相似性时,TRA方法在强调三角形重要性的同时,并没有忽略任何共同邻居的贡献。另外,该方法中还引入了资源分配的思想,对大度邻居的贡献进行了惩罚。实验结果显示,TRA方法的预测性能优于对比方法。
2.在无权网络上进一步研究了基于社团结构的链接预测问题。为了充分利用社团结构提高预测的准确性,提出了一种新的链接预测模型(CMS)。该模型详细分析了节点的社团成员关系,并假设不同的成员关系对链接的形成有不同的影响。为了评估节点之间连接的可能性,CMS模型根据相应的社团成员关系对共同邻居的贡献进行了加权。通过引入共同邻居的三种不同贡献形式,本文派生了三种基于CMS的链接预测方法。大量的实验分析表明,基于CMS的方法不但有良好的预测性能,而且有很好的鲁棒性。
3.对于加权网络,由于一些网络中存在的弱联系(weak ties)现象,从而导致使用权值后反而会降低链接预测的精度。为了解决这一问题,我们提出了一个无参数的并且能够自动适应链接强度分布的链接预测方法。该方法通过分析网络中三元模体的分布情况,从全局的角度统计不同类型节点对的连接概率,并将其融入到TRA方法之中。与已有的一些考虑弱联系现象的方法相比,该方法不需要参数,并且能够自动调节弱链接的影响。实验结果显示该方法能够克服弱联系现象带来的负面影响,取得了较好的预测性能。
4.对于多层网络上的链接预测,为了融合不同层的结构信息,提出了基于多属性决策的预测方法。许多研究表明多层网络的不同层之间的拓扑结构通常具有一定的相关性,因此结合不同层的信息可以提高预测的性能。本文将多层网络上的链接预测视作多属性决策问题,其中,目标层中潜在的链接为候选方案,每一层网络表示一个属性,潜在链接在每层的相似性分数代表属性值。实现中,采用TOPSIS方法对候选方案进行排序,利用层间相关性对属性进行加权。实验表明,该方法对参数和层间相关性指标不太敏感,具有很好的预测性能。
本文研究复杂网络中基于节点结构相似性的链接预测方法,基于相似性的链接预测方法认为,相似性越高的节点间越可能出现链接。研究发现,节点的相似性受到共同邻居、社团结构、链接权重等许多因素的影响。本文针对不同类型的复杂网络,结合共同邻居、社团结构、链接权重等网络结构特征对基于结构相似性的链接预测方法进行了深入的研究,主要包括以下四个方面:
1.在无权网络的链接预测问题上,受网络的三角形增长机制的启发,提出了一个新的基于三角形结构的相似性预测方法(TRA)。与CAR和CCLP等方法中用到的三角形不同,本文定义了一个新的三角形结构,它能够更准确的评估种子节点与共同邻居之间的亲密程度。在计算节点间相似性时,TRA方法在强调三角形重要性的同时,并没有忽略任何共同邻居的贡献。另外,该方法中还引入了资源分配的思想,对大度邻居的贡献进行了惩罚。实验结果显示,TRA方法的预测性能优于对比方法。
2.在无权网络上进一步研究了基于社团结构的链接预测问题。为了充分利用社团结构提高预测的准确性,提出了一种新的链接预测模型(CMS)。该模型详细分析了节点的社团成员关系,并假设不同的成员关系对链接的形成有不同的影响。为了评估节点之间连接的可能性,CMS模型根据相应的社团成员关系对共同邻居的贡献进行了加权。通过引入共同邻居的三种不同贡献形式,本文派生了三种基于CMS的链接预测方法。大量的实验分析表明,基于CMS的方法不但有良好的预测性能,而且有很好的鲁棒性。
3.对于加权网络,由于一些网络中存在的弱联系(weak ties)现象,从而导致使用权值后反而会降低链接预测的精度。为了解决这一问题,我们提出了一个无参数的并且能够自动适应链接强度分布的链接预测方法。该方法通过分析网络中三元模体的分布情况,从全局的角度统计不同类型节点对的连接概率,并将其融入到TRA方法之中。与已有的一些考虑弱联系现象的方法相比,该方法不需要参数,并且能够自动调节弱链接的影响。实验结果显示该方法能够克服弱联系现象带来的负面影响,取得了较好的预测性能。
4.对于多层网络上的链接预测,为了融合不同层的结构信息,提出了基于多属性决策的预测方法。许多研究表明多层网络的不同层之间的拓扑结构通常具有一定的相关性,因此结合不同层的信息可以提高预测的性能。本文将多层网络上的链接预测视作多属性决策问题,其中,目标层中潜在的链接为候选方案,每一层网络表示一个属性,潜在链接在每层的相似性分数代表属性值。实现中,采用TOPSIS方法对候选方案进行排序,利用层间相关性对属性进行加权。实验表明,该方法对参数和层间相关性指标不太敏感,具有很好的预测性能。