论文部分内容阅读
网络能有效反映各种复杂的关系结构,因此其普遍存在于现实世界中。随着网络的复杂程度越来越高,规模越来越大,针对复杂网络的分析任务也变得越来越困难。为了应对结构越来越复杂,规模越来越大的网络所带来的问题,研究人员提出了网络表示方法,即基于复杂网络中已有信息建立网络表示模型自动学习节点低维向量表示。基于网络表示模型学习的节点向量表示,只需要将已有的机器学习模型做一些适应性的调整就可以解决复杂网络分析中的绝大多数问题,故网络表示模型的性能将直接影响到最终的分析任务。在复杂网络分析中,已有的网络表示工作大都从网络的结构信息出发,用节点相似性来指导网络表示生成,故节点相似性度量的研究对网络表示具有重要意义。在传统的节点相似性度量中已有工作大都以目标节点的共同邻居为基础,而忽略了网络结构中高阶邻居节点以及它们之间的相互关系对目标节点相似性的影响,故本文提出了一种基于图核的节点相似性度量方法。该方法主要基于中心节点所在的子图来刻画网络结构对中心节点相似性的影响,并将这种相似性度量方法应用到符号预测任务中以验证该方法的性能。实验结果显示,相较于其他传统方法,基于图核的节点相似性度量方法能显著提升符号预测的性能。在已有的网络表示方法中,网络结构信息是所有表示模型的基础;但由于网络结构的稀疏性,使得基于结构的相似性计算以及基于矩阵分解的方法变得困难,故为了解决网络稀疏性所带来的问题,本文提出了一种基于边对偶图(Edge-Dual Graph)的网络稀疏性改善模型,通过将原始网络转换为边对偶图,不仅能改善网络的稀疏性,还能将原始网络中基于链接的任务转化为边对偶图中基于节点的任务。为验证该方法的有效性,本文中将Jaccard相似性作为核函数,并利用用核SVM预测原始网络的链接符号。实验结果表明,该方法在改善网络稀疏性的同时,还能提高已有工作的符号预测性能。结构信息是网络的基本信息,能从复杂的网络结构中挖掘出有效信息是网络表示模型的关键。而在复杂的结构中,任意一种相似性度量方法只能获取部分的网络结构信息,故依赖单一相似性的网络表示模型在根本上缺乏获取完整网络信息的基础。本文中为了充分挖掘网络结构信息,提出了一种基于多种相似性的多视图网络表示模型。该方法,首先基于不同节点相似性组合为网络生成若干潜在的网络表示空间,即视图;然后使用基于典型相关分析的方法来学习生成的视图之间的共同表示空间,并且通过神经网络模型学习不同视图空间的特征表示空间;最后融合基于多个视图学习到的共同表示空间和特征表示空间作为网络的完整表示。实验结果表明,该方法充分考虑了节点在网络中的不同结构信息,故可有效改善实际网络上的节点分类性能。随着网络越来越复杂,网络数据中除结构信息之外,节点或链接本身也有一些属性信息,故基于网络结构的方法在一定程度上会因为对信息的利用不充分而使得在最终的网络表示方法学得的表示向量无法反映节点在网络中的全部信息。虽然有些工作尝试结合网络的多种信息学习网络的向量表示,但它们没有充分挖掘网络中的信息,故本文提出了一种基于异构信息的网络表示模型(HINE),并用节点分类任务来验证该方法的有效性。HINE模型通过融合网络中的用户属性、链接、社区以及标签等信息来学习网络的最终表示。实际数据集上的验证实验表明,该方法在节点分类上比已有的工作性能有所提高,尤其是在低维空间下,该方法可显著提升节点分类性能。