论文部分内容阅读
现实世界中,存在大量复杂系统,如生物、电力和社会关系系统等。复杂网络以抽象化的形式可以表示这些复杂系统,其中系统中的个体用网络中的节点表示,个体之间的关系用连边表示。研究复杂网络对探索网络形成及演化机制意义重大,而链路预测则将复杂网络与信息科学紧密联系起来。复杂网络会随着时间的发展而动态变化,对其进行挖掘与研究,对复杂网络内部的演化机理的研究意义重大。链路预测就是复杂网络领域的一个重要分支,是通过已知的网络结构和网络节点属性信息等,预测网络中两个节点间互相连接的可能性。链路预测是数据挖掘的一个重要方向,可以用于研究动态网络的演化,进行不完整网络的信息补全等。随着链路预测技术的快速发展,许多相似性算法相继提出。传统的链路预测算法主要包括基于局部信息、基于全局信息和基于随机游走的链路预测算法。本文主要研究基于局部信息的链路预测算法。在网络的局部信息中,网络中的节点属性经常是难以获得的,即使获得也常常伴随着噪声数据,因此近些年来基于网络局部结构的链路预测方法日益受到人们的关注。局部群落结构是真实网络中普遍存在的特殊网络拓扑结构,本文针对这一特定的局部结构的链路预测算法进行了较为深入的研究。本文定义了两种计算节点相似性的方法,进而提出了两种新的面向局部群落结构的链路预测算法,主要工作与贡献由以下两个方面组成:1.真实网络中存在大量的局部群落结构,针对不同的网络结构构建算法是链路预测的核心问题。利用社交网络好友推荐策略提出的FR算法无法区分候选节点和中介节点间的亲疏关系,考虑到中介人倾向于将自己更熟悉的人介绍给目标用户,提出了一种节点相似性度量指标,并且提出了加权好友推荐模型链路预测算法,简称WFR(Weighted Friend Recommendation)算法。该指标结合局部特征描述并有效区分了用户节点之间影响力的不同,更适用于一类特定的局部群落结构。从相似性指标的选取对算法的影响、权重比例变化对算法的影响和人工生成的典型网络环境下算法的适用分析三个角度对提出的算法的性能进行了全面的分析。根据该指标提出的加权的好友推荐模型链路预测算法在12个真实网络数据集进行了实验,实验结果表明该算法在AUC和Precision两个评价指标上具有明显的优势。2.目前大部分的链路预测算法都没有引入足够的网络信息,导致链路预测的预测性能不佳。局部节点嵌入的方法能够提取出更多网络信息,使用局部节点嵌入的方法构建的节点相似性指标进行的链路预测往往能获得比较好的性能。因此,本文结合好友推荐FR算法和局部节点嵌入DeepWalk算法构建相似性指标,提出了一种新的节点相似性度量指标和基于局部节点嵌入的链路预测算法,简称DFR(DeepWalk plus Friend Recommendation)算法。该算法结合局部群落特征描述并能更准确地获得目标节点的拓扑结构信息,更适用于一类特定的局部群落结构和大规模的网络。该链路预测算法在12个数据集上的实验结果表明,该算法在AUC和Precision两个指标上具有优势,尤其是在较少的训练集下即可得到较好的训练效果。