大规模图介数近似计算方法研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:wanghuaimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介数中心性计算是复杂网络分析中的一个基本问题,它用来衡量一个节点在复杂网络中的重要程度。近年来,介数中心性已经广泛用于社交网络分析,打击恐怖组织网络,治理城市交通网络等。对于介数中心性的计算,不仅是计算机领域研究的热点问题之一,也同样受到其它领域研究人员的关注。然而随着移动互联网的普及,数据量的爆炸式增长,数据的拓扑结构也越来越复杂,传统的图介数计算算法已经无法完全满足图介数计算的需求,甚至在某些情况下由于计算代价过大而显得不切实际,因而研究的热点逐渐转向对图介数的近似计算。本文深入研究了国内外介数中心性的研究现状,发现无论是能够准确计算介数值的算法还是近似计算介数的算法,在大规模图上的计算都有各自的优缺点。准确计算介数值需要计算图中任意一对节点之间的最短路径,需要极大的时间开销。当前对于大规模图介数近似计算的思路主要有两种,一是基于源节点的抽样算法,选取部分源节点进行单源最短路径计算;二是通过对最短路径的近似计算从而提高整个算法的计算速度。在此基础上将二者融合,探索采取何种策略选取源节点以及源节点的选取数量,从已选源节点出发如何在大规模图中近似计算最短路径就成为一种可行的研究方向和解决方案。本文利用复杂网络的小世界特性和无标度特性,即复杂网络中大部分的路径长度都较短,大部分的最短路径都会经过某几个节点度较高的节点。本文提出一种适合大规模图介数近似计算的算法,将节点度高的节点设为中枢节点,利用统计学习中的VC理论对中枢节点的选取数量进行定量计算,从而使得选取数量不再依赖于图数据的规模,而仅仅依赖于图直径。通过任选k条最短路径求出图直径的近似值,计算需要选取的中枢节点数量并根据已记录的节点度从大到小选取。围绕已经选取的中枢节点,用广度优先遍历算法将整个图分为若干个区域,分别在每个区域上执行Mixed策略选取源节点,即依次执行Random策略,MaxMin策略,MaxSum策略,每次执行完一种源节点选取策略后,采用自适应的方式对源节点的选取数量进行控制,直到在所有划分区域上完成源节点选取。根据介数定义公式,用从源节点出发经过中枢节点的较短路径来代替最短路径,从而完成大规模图介数的近似计算。最后通过与其他三种知名介数近似计算算法的实验比较,证明本文提出的大规模图介数近似算法具有良好的效率和准确性。
其他文献
伴随着互联网技术的快速发展,原有的IPv4地址已经不能满足日益增长的网络业务需求,继而产生了NAT技术——其出现以及发展强有力地缓解了IPv4地址不足的问题。但NAT技术引起的
SDN(Software Definded Network,软件定义网络)是一种新型的网络创新架构,它是实现网络虚拟化的方式之一,SDN的出现实现了网络设备控制层与转发层的分离。从而通过SDN控制器
Takagi-Sugeno-Kang(TSK)模糊系统在处理高维非线性建模任务时,通常需要更多的模糊规则数,这也进一步降低了其清晰度和解释性,所以本文研究如何稀疏模糊建模。随着异构数据的
由于用户对数据的安全性和隐私性的要求不断提升,越来越多的企业用户开始建设自己的私有云平台,其中以云桌面(Cloud Desktop)应用最为典型。为了增强云桌面的用户体验,向用户
在过程工业中,很多关键的质量参数无法实时在线测量,只能通过实验室离线分析获得,严重制约了过程的监测、控制及优化水平。为此,软测量技术通过建立易测变量与难测变量之间的
数据分析技术在各个领域应用广泛。其中,聚类分析作为一个重要研究方向,获得了极大的发展。数据竞争(Data nCompetitio,DC)算法是一种基于划分的聚类算法,能够排除孤立点带来
当前,互联网的应用模式已经从发送者驱动的点对点通信为主转向接收者驱动的大规模信息获取为主。内容中心网络(Content Centric Network,CCN)顺应这一应用模式的转变,实现了
科技不断发展,各门学科与计算机领域的结合越来越紧密,图作为重要的数据结构,其应用范围不断拓广。蛋白质网络,社交网络以及电子商务网络等,都是以图进行建模的数据。随着互
研究背景:寨卡病毒(Zika virus,ZIKV)是一种蚊媒传播病毒,可引起ZIKV病。人感染ZIKV后严重可导致成人格林巴利综合征;孕妇感染病毒后可能引起新生儿小头畸形。2016年ZIKV病在
由于计算机科学技术的飞速发展,使得网络越来越复杂和多样化,这给网络和信息系统的安全管理带来了新的挑战。单一使用“检测”、“容忍”网络和信息技术难以保证网络在无干扰