大规模动态图上位置查询处理的关键技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:boymaster
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实世界中,绝大多数图数据都在随时间发生动态演化。近年来,随着大规模“动态图”数据的不断涌现,面向大规模动态图数据的查询处理逐渐成为图数据管理中非常重要的一类任务。其中,面向大规模图上的位置查询处理是一个十分重要的研究方向,该方向主要包括两类图数据上基础的查询问题:顶点可达性查询与k-近邻查询。对于动态图上的可达性查询问题,我们重点关注结构变化动态图上基于历史区间的可达性查询,即:给定动态图的拓扑结构会随时间发生变化,且对于变化过程中的一段历史区间,判断顶点u和v在此历史区间内是否可达。当前仅有极少数工作涉及针对该方向的研究,且其大都侧重于利用增量式更新策略快速重建任意时刻图快照,进而在重建图快照上完成可达性查询。然而,重建大规模动态图的快照需要昂贵的代价,这在现实应用场景下是难以接受的。仅有少量工作考虑通过构建查询索引的方式来回答用户给定查询,然而其构建的查询索引大都包含各类约束条件,进而限制了查询的性能。对于动态图上的k-近邻查询,我们更关注于内容变化的动态图,即:图中边上的权重会随着时间发生改变。在该问题中,用户给定出发时刻,查询需要返回在该时刻出发时距离查询点q最近邻的k个对象。基于内容变化的动态图的特点往往被刻画成时间依赖图模型,这也导致现有的大量基于构建静态查询索引的k-近邻查询算法无法适用于该时间依赖图模型。本文对上述两个问题分别设计了相应的高效查询算法,具体的工作如下:1.该课题中,我们设计了一种兼具合理时空开销和查询可用性的全新可达性查询索引架构,并基于图着色问题给出了相应的优化策略,使其能够有效地解决结构变化动态图上两类基于历史区间可达性的查询问题。2.针对内容变化的动态图上的k-近邻查询,我们在原有索引框架的基础上提出了一种全新的二级索引架构,进一步提高了查询效率。本文主要研究面向大规模图上的位置查询处理,并围绕顶点可达性查询与k-近邻查询两类图数据上基础的查询问题分别设计了相应的高效查询算法,并通过在多个真实数据集上进行大量实验验证了其有效性及高效性。
其他文献
沿海地区经济的快速发展,使得土地资源的需求量不断增加。但随着工业的发展,滨海盐碱地区土壤重金属污染现象日益严重,这不仅降低了土地利用率,对城市环境也会产生不良影响。因此滨海重盐碱地区重金属的污染修复受到了广泛的关注,其中存在的盐碱成分又使得重金属的修复更具难度。根据研究发现,重金属的原位修复方法中,化学钝化方法以其便利性和实用性受到广泛应用。本文在实验室已有研究的基础上,探究新型重金属钝化剂——水
学位
尽管在过去的发展历程中,多视图学习领域取得了很大进步,但是由于很难对不同视图之间的复杂关联进行建模,这个问题仍然十分具有挑战性,尤其是在视图有缺失的情况下。为了应对这一挑战,本文提出了一个新颖的模型框架,旨在充分地、灵活地利用具有不同缺失模式的各个视图的数据。本文首先为多视图表示提供完备性和通用性的正式定义,然后从理论上证明了所学习的隐空间表示的通用性。对于完备性,通过模仿数据的信道传输理论,将学
学位
计算机视觉和自然语言处理是两个非常热门的研究方向,其中包括图像或视频的分类、检测、分割等视觉任务或是机器翻译、文本摘要、问答系统等自然语言任务,这些任务目前已有很多基于深度神经网络的模型。现实生活中,大部分时刻需要同时理解视觉和自然语言信息,因此,目前在两个领域结合的方向,涌现了很多新的任务:如视觉描述生成、文本图像生成等内容。这其中,视频问答任务近几年取得了飞速的发展,它要求模型输入视觉信息和问
学位
由于RDF图数据的急剧增长,传统的集中式数据处理已经不能满足当前需求,必须通过分布式集群来存储和处理大规模RDF图数据。RDF图数据的分布式存储面临的第一个问题即是RDF图划分。这就使得如何有效地划分大规模RDF图变得尤为重要。本文对现有的RDF图划分算法进行整理,将图划分算法分为3种类型,分别是多级图划分算法、流式图划分算法和分布式图划分算法,详细描述了其中的代表性算法。通过在合成数据集与真实数
学位
目前深度学习已经在多个领域中获得了令人瞩目的成就,但深度学习的成功往往依赖于大规模有标注的数据集,这不仅限制了其在特定领域的应用,也与人类能够从少量样本中快速建立概念有较大差距。小样本分类旨在通过少量有标注样本学习出有效的模型,能够对新类进行识别。而半监督条件下的小样本分类则是对当前小样本研究的进一步拓展,半监督条件一方面更加贴近人类对于事物类别的认知方式,另一方面在实际应用中无标记的数据的收集往
学位
随着天文观测数据的日益丰富,天文学研究已经进入大数据时代。随着光学望远镜制造技术不断发展,高分辨率和宽视场的天文光学观测图像数据持续增速积累。对于时域天文学研究,天文学家通常关注于某一片天空区域内发生的变化或者某一个星体自身发生的变化,并不需要处理所有的归档图像数据,因此如何保证能够快速从海量的归档数据中检索出天文学家所需要的图像序列是一个亟待解决的挑战。本文面向基于光学图像数据的时域天文学研究,
学位
天文观测对大气环境质量、防信号干扰能力等方面的要求非常高,因此,观测条件越好的地点越是人迹罕至。由于观测地点长期无人值守,在观测站点部署高可靠、低成本的远程数据传输系统非常有必要。例如,南极昆仑站天文观测现场与国内数据中心之间只能依靠铱星通信系统进行数据传输。然而,铱星通信网络的带宽极为有限,并且相当不稳定,流量成本也非常昂贵。因此,常规的数据传输工具,例如rsync和scp,并不适用于这种传输场
学位
语音合成(Text-to-Speech,TTS)是一种将输入文本转换为合成语音的技术。在人机交互场景中,语音合成作为交互链条中最后一步,具有举足轻重的地位。目前随着端到端技术的提出和日趋成熟,单语种单说话人语音合成系统,已经能够合成与人类发音具有相似自然度的语音,但是在实际应用场景中,单语单说话人语音合成系统已经无法满足人们的日常需求。比如在导航系统中出现的含有英文单词的地址,日常交流中出现的英文
学位
随着数字化时代的到来,数据的形态非常丰富,描述同一实例的不同类型数据被称为多视角数据。基于多视角数据,多视角学习旨在通过融合来自多个视角的补充信息来发现潜在的表征。可以根据数据的完整性将多视角学习分为完整视角表征和缺失视角表征,本文围绕完整视角和缺失视角的表征学习展开研究。对于完整视角的表征学习,基于子空间学习的方法是目前较为主流的方法,但是当前基于子空间学习的方法存在两个缺点:(1)多视图关系未
学位
视频作为一种重要的信息载体,随着计算机技术和智能设备的快速发展,在人类生产生活中扮演了日益重要的角色。在人工智能领域,基于深度学习的视频分析技术也受益于多种基础任务的发展,在各种细分领域有着广泛的应用。视频问答任务结合了视频的视觉信息和文本的自然语言信息,能够让智能机器跨越模态的鸿沟,提升跨模态语义理解能力。近年来受到了大量关注。基于视觉和语言的视频问答作为一个极具挑战性的研究方向,涉及计算机视觉
学位