基于结构相似性的链接预测方法研究

来源 :兰州大学 | 被引量 : 1次 | 上传用户:Phoenix_Ex
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,各种复杂网络大量涌现,对复杂网络的分析和研究已形成了一门新兴的交叉学科。作为复杂网络分析和链接挖掘的一个重要研究方向,链接预测吸引了来自不同领域学者的广泛关注。链接预测能够根据已知的节点属性、网络结构等信息预测网络中未知的链接以及未来可能出现的链接,因此,无论是在帮助人们认识和理解网络的结构与演化机制等理论方面,还是在产品推荐、指导生物实验等应用方面都有重要的研究价值。
  本文研究复杂网络中基于节点结构相似性的链接预测方法,基于相似性的链接预测方法认为,相似性越高的节点间越可能出现链接。研究发现,节点的相似性受到共同邻居、社团结构、链接权重等许多因素的影响。本文针对不同类型的复杂网络,结合共同邻居、社团结构、链接权重等网络结构特征对基于结构相似性的链接预测方法进行了深入的研究,主要包括以下四个方面:
  1.在无权网络的链接预测问题上,受网络的三角形增长机制的启发,提出了一个新的基于三角形结构的相似性预测方法(TRA)。与CAR和CCLP等方法中用到的三角形不同,本文定义了一个新的三角形结构,它能够更准确的评估种子节点与共同邻居之间的亲密程度。在计算节点间相似性时,TRA方法在强调三角形重要性的同时,并没有忽略任何共同邻居的贡献。另外,该方法中还引入了资源分配的思想,对大度邻居的贡献进行了惩罚。实验结果显示,TRA方法的预测性能优于对比方法。
  2.在无权网络上进一步研究了基于社团结构的链接预测问题。为了充分利用社团结构提高预测的准确性,提出了一种新的链接预测模型(CMS)。该模型详细分析了节点的社团成员关系,并假设不同的成员关系对链接的形成有不同的影响。为了评估节点之间连接的可能性,CMS模型根据相应的社团成员关系对共同邻居的贡献进行了加权。通过引入共同邻居的三种不同贡献形式,本文派生了三种基于CMS的链接预测方法。大量的实验分析表明,基于CMS的方法不但有良好的预测性能,而且有很好的鲁棒性。
  3.对于加权网络,由于一些网络中存在的弱联系(weak ties)现象,从而导致使用权值后反而会降低链接预测的精度。为了解决这一问题,我们提出了一个无参数的并且能够自动适应链接强度分布的链接预测方法。该方法通过分析网络中三元模体的分布情况,从全局的角度统计不同类型节点对的连接概率,并将其融入到TRA方法之中。与已有的一些考虑弱联系现象的方法相比,该方法不需要参数,并且能够自动调节弱链接的影响。实验结果显示该方法能够克服弱联系现象带来的负面影响,取得了较好的预测性能。
  4.对于多层网络上的链接预测,为了融合不同层的结构信息,提出了基于多属性决策的预测方法。许多研究表明多层网络的不同层之间的拓扑结构通常具有一定的相关性,因此结合不同层的信息可以提高预测的性能。本文将多层网络上的链接预测视作多属性决策问题,其中,目标层中潜在的链接为候选方案,每一层网络表示一个属性,潜在链接在每层的相似性分数代表属性值。实现中,采用TOPSIS方法对候选方案进行排序,利用层间相关性对属性进行加权。实验表明,该方法对参数和层间相关性指标不太敏感,具有很好的预测性能。
其他文献
细菌在其生长和繁殖过程中,进化产生了七种不同类型的分泌系统(Ⅰ-Ⅶ型)。Ⅵ型分泌系统(T6SS)是最近几年发现的一类结构复杂的接触依赖型的效应蛋白分泌途径。该系统主要是通过其复杂的结构接触细菌或真核靶细胞,将一些效应蛋白分泌进入靶细胞内部。目前研究发现Ⅵ型分泌系统的主要功能有:(ⅰ)介导细菌与宿主细胞之间的相互作用;(ⅱ)参与细菌和细菌之间的“战争”;(ⅲ)增强细菌自身对极端环境适应的能力。因此,
在植物漫长的进化历史中,地质运动以及气候变迁等事件驱动着植物生境的多次变化,并逐渐演化成为现存的地理分布格局。作为生物多样性的重要基础,遗传多样性是物种长期生存、进化和适应的结果。历史和现代微进化过程造就了当代物种的遗传多样性和遗传结构。高山栎组植物(Quercus sect. Heterobalanus)是一类硬叶常绿的栎属植物,集中分布于横断山脉地区,其现存的分布格局与喜马拉雅-横断山脉的隆升
学位
该文采用人工神经网络对短期负荷预测问题进行研究.针对美国东北地区的PJM电网,根据其历史负荷数据对影响当地负荷特性的因素进行了分析,在分析的基础上,运用神经网络按日型、季节建立了日负荷预测模型,按日型建立了小时负荷预测模型.在面向对象的编程思想指导下,开发了包括神经网络类、遗传算法类和节日算法类的类库,在神经网络的实现上,可以生成任意复杂的多层前馈网络预测模型.此外,建立了节日查询算法来查询部分重
学位
对于柴油机微粒排放的控制,目前普遍采用的是柴油机微粒过滤器(DPF),通过这种方式能除掉绝大部分的碳烟微粒.然而过滤器的再生却一直是一个很难解决的问题.该文采用了一种新的方法对柴油机微粒过滤器的再生进行了试验研究,即利用HO分解产生的活性基团和碳烟进行反应,从而在较低的温度下将碳烟烧掉.试验在165FA柴油机试验台上进行,应用了壁流式不锈钢丝网滤芯的过滤器,并取得了良好的再生效果.在离线和在线两种
随着我国现代化的进程不断加速,城市与城市之间的交通以及城市内部间的交通设施越来越完善,为了更好的进行城市管理和提供市民更好的生活质量,智慧城市与智慧交通等领域在全国各城市快速兴起。为了更好的管理交通,交通标志牌的完好是必不可少的,纵观国内外,很多学者对交通标志的检测与识别做了大量的研究,但鲜有研究人员针对交通标志牌上的交通标志是否被遮挡进行研究,所以本文主要针对交通标志牌上遮挡物的检测与识别进行研
学位
4K高清、5G互联网等技术给予了人们随时随地记录和分享所见所闻的机会。人们在追求传播速度的同时,也开始追求质量。由于高动态范围图像可以记录普通动态范围图像以外的信息,受到了各行各业的关注,例如电影、游戏等行业。与普通的动态范围图像不一样,高动态范围图像的动态范围很广,而且不同的高动态范围图像的动态范围不尽相同。一般显示器只能显示一定动态范围内的图像难以用一种显示器去显示所有的高动态范围图像,还要求
序列密码是对称密码体制的重要实现方式之一,在密码算法的设计中,常常使用非线性函数作为基本的密码部件,使用布尔函数是实现非线性函数的一种有效途径。为了抵抗已知的密码攻击手段,非线性布尔函数必须具有理论可证明的能够有效抵抗已知密码攻击的性能。2003年之前,在流密码中使用的布尔函数必须同时兼具以下几个性质:平衡性,高非线性度,高代数次数,高的弹性阶以及良好的自相关性质。Courtois和Meier于2
学位
推荐系统的目标就是根据用户过去的行为和偏好,对用户未来的行为或偏好做出预测和推荐。因此,大量的用户行为数据的存在成为了推荐系统使用的前提条件。对于像阿里巴巴、京东商城这样的大型电子商务网站来说,他们已经累积了海量的用户数据,但对于一些小型的、更专注于推荐任务的网站,他们则希望在开始阶段就能够对用户进行个性化推荐,如何在缺乏大量的用户数据的情况下对用户行为或偏好做出精确的预测成为了推荐系统的一大难题
学位
异常检测作为数据挖掘的一个重要分支,其应用范围非常广泛,如欺诈检测、入侵检测、生态灾难预警、公共健康、制药领域、反垃圾、气象预报等。随着移动互联网、云计算、物联网的快速发展,数据的生产者、生产环节都在极速攀升,不仅数据量呈指数级增长,数据的维度也在不断增大。针对高维数据处理所面临的“维度灾难”问题给传统异常检测方法带来了巨大挑战。孤立森林是一个经典的异常检测方法,它利用超平面切割数据空间隔离异常的
学位
随着网络技术的快速发展,网络业务流量急剧增加,导致互联网复杂性变高,并带来诸如网络拥塞等一系列威胁网络安全的问题。研究表明网络流量数据的自相似性、长相关性、多分行性和周期性等重要特性已经在很多方面有了广泛应用,自相似理论和流量预测更是在网络流量研究领域占据着重要地位。网络流量数据在很大程度上依赖于它的自相似性和高度非线性,导致这些特点很难完全被预测模型全部捕获。通过对过去时刻网络流量状况的观察分析
学位