大规模图的最短路径编码研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:yy20090907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
寻找任意点对之间的最短路径是图数据管理中典型的、重要的基本操作之一。随着各种大型网络数据的不断涌现,实现在线的最短路径查询成为了当前图数据管理领域迫切需要解决的问题。为此,通常需要通过预计算最短路径并将其组织成为合适的索引结构,从而实现常量时间内的最短路径查询(SPQ)回答。然而,直接的最短路径索引方案需要消耗O(N2)的空间代价,这对于大型网络而言是无法承受的。针对这一问题,本文提出了一种基于区间表示的第一跳划分表示方法。经过对该问题的形式化定义和分析,证明了该问题是NP难问题。为了使得算法能应用于大网络,本文提出了多种启发式编码生成方案。按核心算法分类,本文提出的方法可以分为基于旅行商问题的编码生成方法和基于区间树的编码生成方法两类;按编码数量分为单编码方案和多编码方案两类;按算法框架分类分为独立区间编码算法和与其它已知最短路径索引算法整合算法两类。此外,针对两个第一跳划分的距离计算问题,提出了基于划分二部图的第一跳划分距离近似算法,并证明了其算法近似度。模拟网络和真实网络上的实验结果表明,本文所提的算法在索引空间代价以及查询响应时间上都明显优于目前公认的流行算法。此外,本文的方法具有普适性,可以直接应用现有的流行算法,在不损失影响查询效率的同时进一步降低最短路径索引代价。
其他文献
缺点和不足,即基于关键字的信息检索系统无法保证用户查询的高质量反馈的问题,本文通过对语义检索和本体技术进行研究,将它们引入到信息检索领域中,从而构建基于本体的语义检索系
在动态、开放和个性化的网络平台上,软件容易受到环境变化和用户需求改变的影响。系统管理人员为维持软件的正常运行,对软件系统进行的管理维护负担日趋繁重,如何使软件系统具有
汉语分词作为中文自然语言处理研究的基础性工作,在中文信息处理中扮演着重要的角色。随着中文信息处理的发展,特定领域汉语分词的需求增大。但是由于特定领域分词标注语料匮
随着互联网用户规模的不断增长和网络服务内容的急剧膨胀,内容加速技术得到了广泛应用。内容分发网络CDN(Content Delivery Network)技术作为内容加速技术中最为有效的方式之一
自2012以来,MOOCs(Massive Open Online courses)在全球范围内迅速发展,MOOCs为了适合人们在网上学习,把学校中的课堂碎片化,移植到互联网环境中。MOOCs改变了现代教育的方式
细胞代谢是一切生命活动的基础,代谢网络中的生物化学反应之间的相互作用维持了细胞的新陈代谢。生物代谢网络是一个动态的、有序的网络,代谢网络的失衡则会导致众多疾病的发
关系数据库用来存储结构化数据,并使用SQL语言对数据进行查询,这种方式需要用户掌握这种语言的语法以及数据库的模式知识,因此对用户来说门槛比较高。而互联网上信息检索常常
数字家庭是以计算机技术和网络技术为基础,通过有线网络或无线网络将家庭中的各种通信设备、计算机设备、家用电器、安防设备等连接在一起,提供集成的数据、语音、多媒体、控制
随着异构本体的规模不断增大,当前的本体映射算法在处理大规模本体时会遭遇严重的效率问题。目前针对大规模本体映射大多采用先分块,再在分得的小块间进行块内映射。但是,对大本
计算机双目立体视觉是立体视觉技术中的一个研究热点,利用摄像机从不同角度拍摄物体所得的图像,就可以恢复出物体的三维空间结构信息,而三维空间结构信息数据是三维物体重建的依