论文部分内容阅读
链接预测是属性网络中常见的一类任务,即预测两个节点之间的边存在的可能性,核心在于构建有效的链接表示。传统的方法往往依靠费时费力的特征工程,但是近年来,表示学习和深度学习的发展为链接表示问题注入了新思想。大量实验表明,从节点表示出发进而构造更有力的链接表示,对于链接预测任务是一条更为便捷且高效的道路。 本文重点在于探讨属性网络上的链接预测问题,核心是如何得到更高效的节点表示。目前,在属性网络中,单属性节点的表示问题已经取得了很多进展,但是多属性节点尚没有得到足够的关注。 本文从一种学习单属性节点表示的主流方法-Node2vec算法出发,首先从原理上分析了它的局限性,然后通过多个链接预测实验论证了其具有浅层学习特征的特点。本文针对该方法的局限性,提出了使用神经网络再学习这一改进方法,多个数据集上的链接预测实验证明了其有效性。 进而本文提出了多属性节点的表示问题。思路是:首先把属性分为主要(感兴趣的)属性和辅助属性,然后针对每一种属性,都抽取出一个网络,再通过Node2vec学到一层浅层的节点表示,然后针对多个属性来源的节点表示,使用神经网络进行高层抽象和深度融合。这种基于Node2vec和神经网络融合多属性节点表示的思路,YouTube网络数据集上的实验多角度地验证了其有效性和可行性。 此外,针对链接预测任务以及Node2vec算法,本文提出了构造训练集和测试集的新方法。在Node2vec这种随机漫步方法中,本文认为常见的随机切分链接集合的做法是不合理的。本文通过对网络节点度的统计分析,提出针对不同度的节点提取不同比例的链接加入测试集的新方法,保证了采样过程对网络节点的全覆盖,尤其是处理多属性节点之间的链接的做法,具有一定的借鉴性。