面向复杂网络的链接预测方法研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:xiao531313486
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中的许多复杂系统都可以使用复杂网络进行建模,因此对复杂网络进行研究能够帮助我们更清晰地了解现实系统的本质。如今,互联网和通信技术的发展让数据共享变得更加方便,数据获取、存储和计算能力的提升有力推动了复杂网络分析技术的进步。链接预测作为复杂网络分析中的一个主要研究方向,旨在根据网络中可观察到的节点属性和网络结构等信息推断网络中缺失的或未来可能出现的链接。由于其重要的应用和理论价值,链接预测受到了许多学者的关注。现有的研究工作大多集中在单层网络。近年来,一些研究人员开始对多层网络的链接预测问题进行了研究。由于其包含更加丰富的内容,多层网络中的链接预测可以帮助研究人员挖掘更多有价值的信息。本文对单层和多层网络的链接预测问题都进行了研究,并提出了以下4个链接预测方法。(1)基于节点连接模式相关性的链接预测方法。网络中节点间相隔的距离越远,彼此的关系就越弱。基于此思想,该方法定义了节点的连接模式,并利用皮尔逊系数计算了节点连接模式的相关性(CNCP)。之后将CNCP与基线相似性指标相结合得到一系列基于CNCP的链接预测方法。在6个真实数据上的实验表明,基于CNCP的预测方法优于基线相似性方法。(2)基于端点适用性的链接预测方法。为了在链接预测中结合更多的结构或属性信息,该方法从节点的角度出发,从一组给定的相似性指标中,选取适用于每个节点的相似性指标。对于目标节点对,分别使用最适用于其端点的相似性指标计算该目标节点对的连接概率,最后将两个连接概率相结合得到最终的相似性分数。在9个真实网络上的实验表明,该方法在异配网络中有非常突出的表现。(3)基于有监督学习的多层网络链接预测方法。该方法将链接预测视为节点对的二分类问题。为了构建节点对的特征向量,该方法从网络所有层中提取拓扑信息。除了采用CN,RA和JC等经典相似性指标作为特征外,该方法还为节点对设计了两个新的特征,即,friendship of neighbors(FoN)和friendship in auxiliary layers(FAL)。在6个真实多层网络上进行的实验表明,该方法的预测性能优于其他对比方法。(4)基于回归和条件概率的多层网络链接预测方法。该方法继续对多层网络中的链接预测问题进行研究,通过结合层内信息和层间信息预测多层网络中的缺失链接。首先,对层内信息使用回归算法计算链接存在的概率,然后利用辅助层信息计算链接存在的条件概率,最后结合两种概率进行链接预测。在8个多层网络上的实验表明,本方法的预测性能优于对比方法。
其他文献
模糊系统是通过语言信息或数据信息来获得反映复杂系统的一种输入-输出关系,虽然它不依赖于精确的数学模型,但却具有逻辑推理、数值计算和非线性函数逼近能力,尤其利用它可把IF-THEN模糊规则转化为非线性映射的系统化程序.目前,国内外诸多学者对于形形色色的智能算法进行了广泛研究,其成果数不胜数.例如,在GA算法中融合BP算法的混合学习算法可以实现模糊系统的自学习,从而达到全局最优和快速搜索.再如,萤火虫
种群个体的等级结构包括年龄、生理尺度、攻击性等,它们对种群发展的动态参数(生育率、死亡率等)有着重要影响,比如年龄较大个体的生育率相对较低,而死亡率较高.在建立种群模型时考虑这些等级差异可使得建模结果更加贴近现实情况,更能准确地反映种群的发展规律.因此,对具有等级结构的种群系统最优控制问题进行研究是很有理论和实际意义的.本文主要研究了两类基于等级结构的种群系统的最优控制问题.第一章首先简要介绍了种
传染病是由各种病原体引起的能在人与人、动物与动物或人与动物之间相互传播的一类疾病.其主要传播方式有接触传染、垂直传染、粪口传染等.传染病的出现和传播给人类的生存和发展带来了严重威胁,因此如何有效揭示传染病的流行规律已成为人们迫切需要研究的课题.通过对所建立数学模型动力性态的研究可以揭示疾病发展的进程,预测其流行规律和发展趋势,从而达到对其预防和控制的目的.本文主要研究了两类具有垂直传染和年龄结构的
5阶幺半群P21在半群簇中有着关键作用.已有的结果表明只有解决5阶幺半群P21=∪{1}的遗传有限基问题和子簇的计数问题,才能确定最小阶数的具有非遗传有限基性质、具有不可数多个子簇或具有可数无限多个子簇的半群.因此P21的遗传有限基问题和子簇的计数问题被M.Jackson和E.W.H.Lee在很多文献中提及.本文考查了幺半群P21的遗传有限基问题,通过分析它
本文主要研究了如下一类带有扰动项的对数Schr(?)dinger方程一Δu+λV(x)u=ulogu2+f(u),x ∈ RN,其中λ>0,N>1,V:RN→R是位势函数,非线性项f满足一定的条件.由于对数项ulog u2的存在,使得方程对应的泛函在H1(RN)上不是C1泛函,所以利用Szulkin提出的一种非光滑变分框架,即将上述方程对应的泛函分解为C1泛函与凸下半连续泛函的和.当正
对于保险公司,假设其盈余过程在纯扩散模型的基础上,为了获取更多的收益,可以将盈余投资于Black-Scholes风险资产和无风险资产;同时,为了降低运营过程中保险公司承担的风险,可以购买比例再保险.结合现有的破产理论和实际情况,定义一个新的停时作为破产时,关于这个破产时的破产概率定义为绝对破产概率.针对公司赔付风险和投资风险独立和负相关两种情况,研究公司的绝对破产概率最小化和最优投资-再保险策略问
基因是单个细胞中代表着生物遗传信息的基本单位,不同基因之间的调控关系形成了基因调控网络。不同的逻辑调节方式会影响基因调控网络中的基因表达,从而对细胞的表型产生同质或异质性的影响。对不同逻辑调节下基因网络的动力学性质的研究既是对生物系统中不同逻辑调节方式的调节机制和特性的揭示,也有助于更加全面地了解整个基因网络的生物功能。对于已有的许多逻辑调节下基因网络的研究,大多数只考虑了基因表达的随机性,它是将
大气边界层高度是影响大气污染生消的关键气象因子之一,其量值的大小决定大气污染物质的垂直扩散能力和近地面污染物浓度,并通过压缩水汽和前体物浓度等在一定程度上影响大气边界层化学过程。中国地域广阔,地形多样,之前由于缺少同一观测标准下,长时间序列,高时空分辨率的边界层实时观测,因而无法准确认知不同地形下边界层演变特征,影响区域污染形成机制的研究进程。为弥补先前研究不足,本研究基于激光雷达云高仪,获得长时
矿业是国民经济发展的支柱产业和基础性产业,矿区周围土壤重金属污染治理是环境保护的重要方面之一。本研究以早子沟金矿为研究对象,为达到了解矿区污染情况,选取合适的修复材料,制定有效保护措施的目的,采用测量矿区周围土壤、植物、沉积物中重金属的浓度及土壤理化性质,计算地质累积指数、风险指数、植物富集及转运系数等方法,对土壤重金属污染程度、来源、风险及乡土植物对重金属的富集情况进行分析。主要结论如下:(1)
一般认为,在环境侵权领域,应由造成损害的行为人承担相应的侵权责任。但现代社会的环境侵权更多表现为以公司等组织形式实施的大规模侵权,而生态环境损害具有后果严重、赔偿数额巨大的特征,行为人自身可能并无承担责任的能力。并且,生态环境损害往往具有潜伏性,损害显现时,污染或破坏主体可能已经不存在,此时生态环境损害赔偿更是求助无门。为使生态环境损害获得及时、充分地修复与赔偿,在世界范围来看,很多国家通过扩大责