大图上可达查询覆盖率问题研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:ccbeilu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可达性查询处理是图数据管理与分析的基本操作之一,一直以来都是研究者广泛关注的热点问题。现有方法通常使用树区间或者基于部分结点的2hop标签来加速查询处理的速度。实际应用中,这种加速查询处理的方法存在两方面的问题。一是在给定特定数据图的前提下,没有人研究应该使用哪种索引比较合适;二是即使使用了树区间或者基于部分结点的2hop标签,也没有人研究应该使用多少个区间或者使用多少个结点来构建2hop标签才合适。本文对区间及结点2hop标签的可达查询覆盖率计算问题展开研究,具体研究内容如下:首先,现有使用树区间来加速可达性查询处理的方法不能明确使用多少个区间。针对该问题,提出通过求解区间覆盖率的方式来解决。针对基础算法时间复杂度太大、不能在大图上使用的问题,提出一种快速计算区间覆盖率的k-DFSIC优化算法。该方法在计算过程中,通过判断生成树中每个结点到其后代结点之间的可达性查询是否能通过区间回答,可避免基础方法枚举传递闭包的代价,加速覆盖率的计算。基于得到的区间覆盖率,可以协助用户在实际应用环境的限制下确定合适的区间个数。其次,现有使用部分结点构建2hop标签的方法不能确定使用多少个结点构建2hop标签合适。针对该问题,提出一种计算部分2hop结点覆盖率的2hop LC算法。该方法在计算过程中,通过在构建2hop标签的过程中对遍历到的结点进行分组,并基于哈希计数索引对分组信息进行组织,可避免枚举传递闭包的高昂代价,加速覆盖率的计算。基于所得到的部分2hop结点覆盖率,可协助用户确定合适的结点个数,从而加速可达性查询处理的速度。最后,基于20个真实数据集进行了实验。实验结果验证了本文所提出方法的可行性和高效性。
其他文献
随着移动通信技术的发展,移动边缘计算得到了越来越广泛的关注,并为未来各种时延敏感型以及计算密集型应用提供了技术保障。特别是移动边缘中的任务卸载技术的发展,为边缘设备在资源受限场景下的任务卸载决策以及资源分配提供了更好的解决方案。此外,移动边缘计算隐私保护技术的发展也为未来用户可以体验更加丰富多彩的网络数码世界提供保障。但目前移动边缘计算技术的相关研究依旧存在许多不足,现有的任务卸载算法在复杂的移动
航天结构件需满足极端服役环境,对产品质量与性能要求极高。其加工过程涉及信息复杂,对加工结果影响巨大。传统的加工过程信息传递模式,存在信息来源离散、表达方式落后等问题,难以保证加工效率和产品性能。数字孪生可以实现工件虚实映射,达到加工过程信息集成的目的。而增强现实技术是一种高效的人机交互技术,能够将虚拟信息融合到物理世界中。本文研究了一种基于增强现实的航天结构件数字孪生加工过程信息虚实融合与交互技术
知识图谱是人工智能应用重要基础资源,以人工智能与制造业结合的智能制造领域也逐渐成为新一代产业革命的核心发展方向。高价值的复杂产品因其复杂性,导致装配困难易错,装配指南便成为了非常重要的辅助工具,利用知识图谱这种图结构的数据格式来储存装配信息数据,更便于这类复杂知识在计算机系统中的存储与检索,以实现装配的快速问答与时效性强的指导,将装配环节也推进到智能制造。本文基于知识图谱技术工具,结合交互设计方法
推荐系统是目前用来缓解信息过载的常用技术。个性化推荐系统依赖于用户的行为反馈数据,包括显式反馈和隐式反馈。诸如点击和收藏之类的隐式反馈由于其收集成本低廉,数据量大并且含有更加丰富的隐藏信息而被广泛研究并应用于推荐系统中,其应用的难点在于对用户行为的解释,隐式反馈的解释高度依赖于各应用领域。本文将电商领域基于多行为隐式反馈的在线推荐问题形式化为多臂赌博机问题,提出了一种基于多臂赌博机的在线推荐模型。
近年来,自动驾驶成为人工智能领域的一个热点问题。设计出性能优越的车辆检测与跟踪算法模型,并将其应用到自动驾驶系统、交通监控系统以及智能停车场系统等多个领域,这成为计算机视觉的主要研究方向。本文在深度学习的基础上,研究车辆检测与跟踪算法,利用深层网络提取车辆特征,不仅达到实时性检测的要求,也实现了较高的准确率。主要创新包括以下几个方面:针对车辆检测问题,本文采用现阶段流行的快速实时的实例分割模型YO
随着医院信息化建设的不断完善,电子病历系统的使用也越来越普遍,由此积累了大量的医疗数据资源。出院小结现病史是这些医疗数据资源的重要组成部分之一,记录了住院患者的健康状况以及诊疗过程,蕴含着丰富的医学知识。然而,出院小结现病史是一种非结构化的叙述性医疗文本,很难直接应用机器学习或深度学习模型进行数据挖掘与分析,在一定程度上阻碍了医疗数据的再次利用。因此,对出院小结现病史进行结构化处理,有助于发掘数据
基于多视角图像的三维重建技术是计算机视觉领域的一个重要的研究方向,该技术在文物保护、场景模拟、医学治疗、人体测量等领域中有着重要的应用价值。随着数字图像处理与三维重建技术的快速发展,人们对三维模型的完整度和细节化的要求越来越高。针对这个实际应用问题,本文针对人体三维重建的相关技术展开了研究,本文主要工作包括:(1)首先本文利用智能手机获取多视角人物图像序列,由于本文的研究目标是对人体进行三维重建,
椭圆是自然界最常见的几何形状之一,现实中的许多物体都具有椭圆的几何特征。在计算机视觉领域,椭圆检测一直是一项基础、重要的任务。在实际应用中,目前的椭圆检测算法还面临着许多问题,例如漏检小椭圆、复杂背景下的目标检测结果中会出现重复椭圆、检测速度不够快难以在线应用等。针对这些问题,本文提出了基于弧段提取的椭圆检测算法,该算法用双阈值从图像边缘中提取出椭圆弧段,将不同类别的三段弧组成三元组,三元组受到弧
回归缺陷指在程序的开发过程中,由于开发或维护人员错误的修改导致正常的工作的程序功能无法正常运行。研究人员们提出了多种回归缺陷定位技术,但很少有研究工作用于定位多线程环境下的并发回归缺陷。并发回归缺陷研究的一个主要的挑战是社区缺乏用于实验的并发回归数据集。为了促进并发回归缺陷领域的研究,并提供一个有效的研究评价基准,本文主要完成了以下工作:(1)基准项目调研。调研了并发和回归缺陷领域的优秀成果,统计
随着移动互联网的快速发展,在线社交成为人与人之间交流的一种重要方式。尤其是在最近的几年,凭借着庞大的用户群体,微博、Twitter、Facebook等社交网络平台获得了巨大的商业价值,但是为平台作出贡献的活跃用户及优质内容的发布者却未得到应有的收益。此外,在传统的网络社交平台中,用户在平台上产生的数据都由中心服务器进行存储,平台可以获取用户的所有信息,这种中心化的数据存储方式,存在着用户信息泄露和