论文部分内容阅读
带符号网络在机器学习和数据挖掘领域有着重要研究和应用价值。带符号网络中的链接预测已经引起了很多领域研究者越来越多的关注。链接预测是网络分析中的重要研究领域。最近,带符号网络中的链接预测引起了很多学者的关注。我们不仅要预测出带符号网络中节点之间是否存在潜在或者将来即将生成的链接,还要预测出链接存在的可能性大小以及链接上所带的符号。除此以外,链接预测的结果还需要尽可能满足社会平衡理论和社会结构理论。现有的带符号的网络的链接预测方法大都是在将传统的无符号网络中的链接预测方法运用到带符号的网络中的方法中,一般都只考虑了符号为正的链接而忽略了符号为负的链接,或者把符号为负的链接也当作是符号为正的链接来处理。所以,专门为带符号网络设计出有效的链接预测算法有十分重要的意义。针对上述问题,本文研究带符号网络中链接预测的有效方法,主要工作以及研究成果有:(1)提出了基于Katz指标的符号预测算法。这种方法是基于经典的社会平衡理论,运用了单分网络中链接预测的衡量节点间相似度的Katz指标,并且考虑了网络的拓扑结构特征,对带符号网络链接的符号做出预测。我们解释了 Katz指标符合带符号网络中的社会平衡理论,论证了将Katz指标应用于带符号网络的合理性。实验结果表明,这种方法在节约时间和成本的基础上大大提高了预测的准确度。(2)为了能够在预测出链接符号的同时,预测出链接为该符号的概率大小,提出了基于隐空间映射的带符号网络的链接预测方法。考虑到社会平衡理论和社会结构理论,我们先定义了一个平衡/地位的权重矩阵来反映未知链接上的平衡/地位约束。并提出了一种结合隐空间和平衡/地位约束的算法模型,通过迭代来优化这个模型。在此模型的基础上对带符号网络中的链接的符号以及该链接存在的概率做出预测。我们论证了该迭代方法的收敛性和正确性。在实际的带符号网络的实验结果表明,该算法比其他算法具有更高质量的预测效果。(3)提出了基于精确度优化的链接预测算法。该方法以精确度为目标函数,将链接预测问题转化为最优化问题。我们对网络中每个有序的节点对都定义一组拓扑特征,并把这些特征当作节点对的属性,从而将符号网络链接预测问题转化为二分类问题,然后通过对精确度的优化来解决这个二分类问题。该算法的实验结果表明,该方法具有较好的鲁棒性,且预测结果准确性高。