论文部分内容阅读
随着信息技术的飞速发展,复杂系统的大量涌现,网络科学作为一门新生学科也得到了快速发展。链路预测作为该领域中的一个重要课题,可以根据已有网络拓扑结构等信息,来发现网络中存在但未知的连边和预测不存在但将来可能形成的连边。链路预测在实践中,可以在社交网络中用来推荐好友、在基因调控中用来发现未知的调控关系;在理论上,则有助于揭示网络的内部结构特征,促进对复杂系统演化机制的理解。目前的链路预测算法主要是根据节点属性或者网络拓扑结构来预测连边,前者在实践中存在节点属性信息难以获取、质量难以保证等问题,而后者仅需知道网络的拓扑结构,但也存在预测精度不高的问题。本文研究属于后者,即仅根据网络拓扑结构来进行链路预测。本文首先在高阶近邻保持嵌入(High Order Proximity preserved Embedding,HOPE)算法的基础上,提出了 一种邻接嵌入(Adjacency Embedding,AE)算法,将网络中的节点用低维、实值、稠密的向量进行表征,通过在低维空间中计算这些表征向量之间的距离来推断节点的相似性,从而预测其间产生连边的可能性。通过对10个真实网络上的实验分析可以得出,相对于HOPE算法,AE算法在保证预测精度的同时,减小了时间复杂度。其次,基于节点之间相似性应当可以传递的思想,本文提出基于AE算法的转移相似性(Transferring Similarity Based on Adjacency Embedding,TSBAE)算法,结合各节点之间的潜在网络结构相似性,克服了 HOPE算法以及AE算法中由于数据稀疏性导致的相距较远的节点之间相似性预测不准确的问题。结果表明,无论是在无向网络上,还是在有向网络上,TSBAE算法都比基准算法、AE算法预测精度高。