多层合作网络中的链接预测

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:lovewxb1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对复杂网络及其特性的研究引起了各领域学者们的广泛关注。复杂网络是真实世界的网络的一种抽象表示。它们在本质上具有高度的动态性,并在不断地演化。此外,复杂网络最初的规模较小,但在大数据时代下,复杂网络的规模以惊人的速度在增长。研究和分析动态大型网络是网络科学家的一大挑战。现实世界的许多系统可以建模成角色之间的合作网络(网络中节点的角色可以是用户,作家,论文,项目,蛋白质等),且这样的网络是动态变化的。复杂网络也可以是在线社交网络,用来描述人与人之间的社交关系,比如朋友之间的交互关系。合作网络展示了一些业务关系(例如,学术合著或合作出版网络,产品联合采购网络等)。生物系统(例如蛋白质相互作用网络)或计算机科学网络(例如互联网和对等网络)等,也是复杂网络的一种。这些系统用图中的节点来表示角色,节点之间的链接表示角色之间的各种相互作用、合作或影响。所有类型的复杂网络都有一些公共的拓扑性质,如直径或平均距离较小、节点度分布服从幂率分布、高聚集系数以及社区结构等。近年来,大量的研究工作都集中于研究复杂系统中单层网络的特性。但是,研究证明,对于大型复杂系统,例如交通网络、社交网络等,由于它们十分庞大、结构复杂多样,如果只研究其中的单层网络的话,将很难捕捉到复杂系统中的链接模式。人们自然会想到将复杂系统中的多层网络融合在一起进行研究。但是如果简单的将多层网络进行叠加,在融合后的网络上做链接预测的话,将失去很多有用的信息。因此,对于复杂系统,有必要考虑其网络的多层次结构,不能仅从单层结构的角度,研究其网络链接的特点。我们需要同时考虑多层网络结构,发现其中的链接模式的规律。因此,在本研究中,为了更好地捕捉复杂网络中的特点,我们构建了一个多层网络模型,这个多层的网络模型同时考虑了两个网络的特点,并基于此提出了一种多层网络模型中的链路预测方法。多复杂性(multiplexity)理论最初来源于社交网络。在社交网络分析中,人与人之间存在着多种多样的关系,由于关系类型的不同,他们之间的交互行为也会有所不同。例如,在社交网络中,人与人之间的关系可以是亲密的朋友关系、邻居关系,也可以是同事关系等。在社交网络分析中,两个人之间的多重关系被称为关系的多样性。事实上,不仅在社交网络分析中存在关系的多样性这一特点,现实世界的其他复杂系统的实体之间也存在着关系多样性的特点。本研究的核心问题是链接预测,链接预测是指预测两个节点之间的链接是否存在,它在复杂网络分析中具有重要意义,也是图挖掘的一个重要方向。一些研究者在该领域已经做出了许多贡献,但直到21世纪初,研究人员将机器学习和数据挖掘应用于此领域后,才得到了如何通过高关联数据的结构性质共同探索提取知识的方法。传统的机器学习方法的缺点是无法准确理解和利用实体之间的关联信息,而这种新的方法充分利用了实体之间的关系的数据。在图这类特殊的数据结构上进行数据挖掘时,图中的边会提供实体间的关联关系,所以当对实体间的关系进行挖掘时,图挖掘的相关方法将很有效。预测网络中新的链接关系即所谓的“未来链接预测”的问题是指通过研究一段时间内网络中链接的出现或消失的记录,预测未来将要出现的链接关系的问题。链接预测在不同领域有着广泛的应用,如向你推荐社交网站中的朋友、识别隐藏的犯罪关系。在医学和生物学领域,找到合适且预测精度足够高的方法去指导实验,不但缩小了实验范围,而且还能提高实验的成功率,在很大程度上降低了实验成本,节省了大量的时间和人力。另外,链路预测的研究与网络演化机制的问题有着密切的联系。了解网络的演化机制,得到其变化的规律,这里所蕴含的规律很可能是复杂网络中链接形成的主要推动力。近年来学者们提出了多种链路预测模型。大多数现有方法只考虑由单层组成的简单网络,其中所有链接都是相同的类型。然而,现实中许多网络通常都是异构的,它们涉及不同类型的链接和节点。例如,关注科学家之间的相互作用,可以定义不同类型的链接:如果两个科学家共同出版了一些研究论文,或者如果他们在同一个会议上发表了他们的文章,或他们的研究领域相同;如果他们在自己的文章中引用了其他科学家的作品,那么他们也可以联系起来。共同作者网络或科学家网络可以通过多层网络更好地建模,异构链接信息可以非常好地用于改进链接预测的结果。合作网络,特别是科学家的合作网络,有各种丰富的信息,可用于各类网络分析任务的研究,如链路预测,社区检测,节点识别等。另外该网络中由于存在不同种类的链接信息,这些网络已被用于研究复杂网络的异构性质。所以,在科学家合作网络这个复杂的大型系统中,研究如何利用多层网络的信息来预测未来潜在的链接关系是有非常意义的。因此,在这项工作中,我们将研究利用多层网络预测某个单层网络中的未来可能产生的链接,充分利用了多层网络中丰富的特征和信息。在我们构建的科学家合作网络中,一个层次上的链接代表两个作者在某个期刊上的合作关系,这样的预测对于发现潜在合作关系进行合作者推荐是有潜在价值的。从广义的多层网络链接预测来讲,我们所给出的方法也具有很好的可推广性,因为它在概念上和结构上都与许多实际的网络分析问题相关。本文主要在科学家合作网络上评估了我们的链接预测方法,数据来自APS(美国物理学会)数据集。链接预测是一个二分类问题。机器学习中分类算法有很多,这里结合我们的数据和实验结果,我们选择了逻辑回归的方法进行链接预测。逻辑回归属于有监督学习算法。在有监督学习中,每个例子都是由特征向量和对应输出标签组成。在我们的问题中,输入就是对节点的一系列特征,包括单层网络上的特征和多层网络特征,输出就是这对节点在未来的一段时间内是否存在链接关系。我们的创新点在于,不同于传统的单层网络的链接预测问题,我们构建了基于多层网络的特征集合,即充分的利用了两个节点在不同网络中的多种关系的信息。具体来讲,我们从数据集中提取相关信息,利用一个特定领域的论文数据构建了三个单层网络。其中两个单层网络的是由2000-2004年来自两个期刊的数据生成的网络,另外一个单层网络是由2005-2009年其中一个期刊的数据生成的网络。我们目标是预测2005-2009年间期刊“PHYSICAL REVIEW LETTERS”上可能出现的科学家之间的合作关系。有别于普通的单层网络上的链接预测问题,为了充分利用科学家之间的交互关系,我们构建了多层网络,该多层网络的第一层网络是2000-2004年,期刊“PHYSICAL REVIEW LETTERS”上的科学家之间合作的信息;第二层网络是同一时间段,即2000-2004年,期刊“PHYSICALREVIEWE”上的科学家之间合作的信息。我们用这个多层网络上的数据来预测2005-2009年,期刊“PHYSICAL REVIEW LETTERS”上的科学家之间的合作关系。在我们提出的基于多层网络的链接预测模型中,我们主要构建了链接的两类特征属性。第一类属性是基本的单层网络特征,第二组属性是基于多层网络的复杂属性,并将我们设计的方法应用于上述数据集中。为了证明我们提出的多层链接预测模型的有效性,我们设计了对比实验。对比实验中,我们仅用期刊“PHYSICAL REVIEW LETTERS”在2000-2004年的科学家合作网络中的链接信息来预测该期刊2005-2009年的科学家合作网络中的链接,即用传统的单层网络链接预测方法。实验结果表明,我们提出的基于多层网络的链接预测模型,即同时用了 2000-2004 年的“PHYSICAL REVIEW LETTERS”和“PHYSICAL REVIEWE”两个期刊的信息,丰富了两个合作者之间的信息,较传统的单层网络上的链接预测方法有更高的准确率。特别是在评价指标AUC这一项上,我们方法的平均值比基准方法的平均值有很大的提升。当然,除了 AUC指标外,F1指标、准确率、召回率这些方面,我们的方法的结果也有提升。
其他文献
这篇文章主要研究二维dilaton引力理论中表观视界附近的粒子辐射。类似于高维时空的霍金辐射的粒子隧穿效应的解释,这里将采用Hamilton-Jacobi方法研究表观视界附近的隧穿效
首先,根据登革热在人群感染治疗和预防接种等特点,我们建立了一类带有感染和疫苗接种时间的登革热传播模型.运用无穷维特征方程理论、疾病持续生存理论和构造合适的Lyapunov
量子关联在量子信息处理与量子计算中起关键作用,如何高效保存和操控各种物理体系的量子关联被人们高度关注。海森堡自旋链模型有较好的操作性且便于量子计算,且多体自旋相互
本文根据Lotka-Volterra捕食模型,通过构建Liapunov函数来研究正平衡点的全局渐近稳定性.该分析表明可以控制有关参数来实现食饵和捕食者的持续共存.在此模型的基础上引入外
“资管新规”以来,我国券商资产管理业务迅速发展,而其中作为主动管理的重要组成部分的集合资产管理业务更是发展得如火如荼。由于现有金融监管制度不完善、金融机构自身经营
渔业资源的可持续开发利用依赖水生动植物的存量和生产量,水生动植物的生存和生长不仅与水域生态环境有关,而且还与人们的开发能力有关,频繁的水华等水污染事件和人类的过度
SrH作为碱土金属氢化物的一员,在天体物理、化学工程和氢能储藏运输等研究领域都有着极其重要的作用。所以研究SrH分子基态及激发态的光谱性质具有重要的实际应用价值和理论
神经元在中枢神经系统处理信息的过程中有着非常重要的地位,神经元能够加工、处理和传输信息,而这些过程有丰富的非线性特征。近十年来,Rulkov和Izhikevich分别应用离散(map-
Calabi-Yau流形上的拓扑弦是数学物理中最为丰硕的领域之一。在数学上,其导出的镜像对称联系起Calabi-Yau上的辛几何与代数几何。本文研究拓扑弦理论中的若干问题,分两部分。
超强激光场中的原子激发现象是强场物理研究领域的前沿课题之一,受到了大量科研工作者的青睐和重视。目前对于强场中原子的激发过程的探究方法多数使用的是中性激发方法和场