长路径关键词覆盖最优路径查询的优化

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:kingerfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词覆盖最优路径查询(Keyword-aware Optimal Route Query,KOR)查找满足关键词全覆盖和路径长度约束条件下,时间开销最小的路线,是旅行规划、路径导航等应用的高频查询。尽可能地缩短KOR的执行时间是KOR优化的最主要目标。现有算法的优化主要是采用高效的路径拓展剪枝策略,缩小搜索空间,降低算法复杂度,但是在查找长路径时,由于搜索深度大,搜索规模的增加依然过大。针对现有算法固有的拓展规模难以控制,长路径搜索执行时间长的问题,本文提出关键词最优路径查询的分段拓展算法SE-KOR(Segmentation expansion algorithm for keyword-aware optimal route query)。SE-KOR根据关键词倒排列表构建关键词顶点路径,然后将路径以关键词顶点为边界划分为多段,逐段拓展,降低搜索规模(深度),从而缩短执行时间。由于SE-KOR在路径拓展时已给出路径走向,而现有剪枝策略不控制路径拓展方向,因此提出局部代价阈值剪枝,控制路径的走向沿关键词顶点路径拓展,并综合运用近似支配、可行解目标值剪枝和全局优先拓展策略,加速拓展。在SE-KOR的基础上,路径拓展并行化是进一步缩短长路径KOR执行时间的有效途径,其关键是如何把逐段拓展,改为同时拓展。本文提出关键词最优路径查询的分段并行拓展算法PSE-KOR(Segmented parallel expansion algorithm for keyword-aware optimal route query)。PSE-KOR根据关键词顶点的个数计算并行度,以相应的关键词顶点为边界,将路径分段,对于每个分段,提出适应并行拓展的可行解目标值剪枝策略和局部代价阈值降低路径之间的关联度和搜索深度,然后并行拓展,进一步缩短执行时间。除此之外,受并行拓展的启发,为进一步加速整个KOR查询过程,本文在数据预处理阶段进行并行操作,缩短预处理时间。并进一步提出分布式预处理方法,实现同时处理多张路网图的功能。本文创新点如下:(1)针对现有算法在面临长路径搜索执行时间长的问题,提出关键词最优路径查询的分段拓展算法(SE-KOR)。该算法以关键词顶点为边界点,将路径分为多段,逐段拓展,降低搜索深度,从而降低搜索规模,缩短执行时间。(2)针对现有剪枝策略不控制路径拓展方向的问题,提出局部代价阈值剪枝,控制路径的走向沿着关键词顶点路径的方向拓展。(3)为进一步缩短长路径KOR的执行时间,提出关键词最优路径查询的分段并行拓展算法(PSE-KOR)。PSE-KOR根据关键词顶点的个数计算并行度,以相应的关键词顶点为边界,将路径分段,利用适应并行拓展的可行解目标值剪枝策略和局部代价阈值降低路径之间的关联度和搜索深度,然后并行拓展。(4)针对预处理耗时长的问题,将串行的预处理操作并行化,并提出分布式预处理方案,实现同时处理多张路网图的操作,进一步加速整个KOR的求解过程。本文从查询关键词数量、代价阈值、误差因子ε和优先级因子β四个方面与现有算法对比。通过一系列实验验证,在保证近似度的前提下,SE-KOR的平均执行时间至少比对比算法KSRG缩短17.5%,PSE-KOR的平均执行时间至少比SE-KOR缩短7.4%。
其他文献
农业机器人的发展是农业现代化进程中不可缺少的一环,农业从业人员的减少、人本成本的上涨以及设施化栽培规模的逐渐扩大,为农业机器人的发展提供了契机和条件。番茄作为最普遍的鲜食蔬菜之一,在我国的栽培规模和食用需求都是极大的,为了保证番茄的品质和产量,在番茄的整个栽培周期中需要不断的进行整枝。在我国,番茄整枝工作主要依靠人工完成,其成本占番茄生产周期中人力成本的40%-60%,因此,研发一款番茄整枝机器人
学位
微表情作为一种独特的面部表情,和一般的表情比较,通常具有如下几个特点:一、动作显现时间特别短暂,一般只有1/25s~1/3s;二、面部情绪动作强度比较低,很难被人们发觉;三、是由人类在无意识状态下产生的;四、对微表情方面的研究通常在视频资料中展开,而对普通面部宏表情的研究在单帧的图片中就可以进行。由于微表情情绪都是由人类在其自身意识没有感知的状态下自发生成的,一般很难被隐藏,能够揭示人类最为真实的
学位
随着深度卷积神经网络的发展,基于深度学习的视频目标检测算法的检测精度和速度都取得了突破性的进展,但其仍面临着诸多挑战。比如逐帧通过大型卷积神经网络提取特征并进行特征聚合,单帧图像检测算法计算资源消耗大,不能满足实时在线的视频目标检测。本文以基于内存增强的全局-局部融合方法(MEGA)为基本的检测框架,提出一种基于特征传播和知识蒸馏的视频目标检测算法,分别从时间维度和单帧图像目标检测维度对MEGA算
学位
目前,语义分割任务主要是通过卷积神经网络提取影像数据中的语义信息,实现图像的像素级分类。随着卷积神经网络的不断发展和完善,基于神经网络的分割模型在语义分割任务中取得较高的准确率,但是这些分割模型在训练过程中通常需要强大的算力支持,无法达到实时分割的效果。现有实时分割算法虽然可以快速对图像进行分割,但在图像边缘部位分割粗糙,无法达到精细分割的效果。为了使分割算法达到精确且快速分割的效果,本文提出了多
学位
猕猴作为人类的近亲,在生理上与人类接近,通过猕猴来探索人脑的工作机制和病理机制是人脑研究的一种重要手段。近年来,跨物种比较神经影像学新技术和方法的研究越来越受到重视,并逐渐成为脑科学研究的热门问题。目前,主要的跨物种比较方法是使用已有同源脑区作为参照系,该方法比较依赖已有同源脑区的信息,而在部分脑区的研究过程中,可能存在先验同源脑区信息缺失的情况。最近的研究表明,在高等灵长类动物中,白质组织在不同
学位
命名实体识别作为自然语言处理领域的一项基础性研究课题,其目标是在句子中辨认并提炼出指定类型的实体词信息。准确的辨别非结构化文本中的实体词可以协助完成诸如智能翻译、自动摘要、情感分析等多项下游任务。材料命名实体识别对机器理解材料领域文献,构建材料知识库起着重要的作用,正确且高效的识别材料实体有助于提高查阅效率并减少重复的科学研究工作。但是目前材料领域命名实体识别还存在着一些不足:(1)目前常用的词嵌
学位
股票价格预测是金融和计算机学科交叉领域的经典问题。由于股票市场内部机制极其复杂,市场波动性极强,准确预测股票价格被认为是最具挑战性的问题之一。深度学习技术在自然语言处理、图像识别等领域的成功应用为解决股票价格预测问题提供了一种新的思路和方法。长短期记忆(LSTM,Long Short-Term Memory)神经网络由于其具有链状、记忆、选择遗忘等的结构,在时间序列预测问题中表现出良好的性能,是目
学位
伴随着工业化进程的快速发展,人们对居住的环境的空气质量提出了更高的要求。气体传感器作为空气质量监测系统的关键原件,其敏感材料的特性对传感器性能有决定性的影响。近年来,新兴的金属有机框架(Metal Organic Frameworks,MOFs)材料为开发高效的气体传感器提供了崭新思路。与传统金属氧化物材料相比,MOFs材料由于具有更大的孔隙率和比表面积,尤其是可调节的孔径以及可变的功能基团,为气
学位
在数据挖掘、生物信息学和文本识别等应用中,高维数据带来了诸多挑战。如何利用特征选择技术从这些复杂的大数据中挖掘出能反映样本信息的关键特征,一直以来都是诸多领域中的关键问题。特征选择旨在筛选出包含重要信息的特征,同时剔除无关或冗余特征,最终获得一个具有最大信息量的特征子集,继而有效降低学习算法的计算成本,并提高数据的可读性和可解释性。本文针对高维数据中重要特征的筛选问题,以互信息和交互信息等信息度量
学位
天文观测手段的进步要求能够高效地从海量数据中发现稀有天文现象。耀发(Flare)现象是一种恒星磁场能量快速释放后缓慢恢复至原有幅度的现象。当前对于耀发样本的研究多根据恒星的磁场信息及其统计特征生成的时间序列数据对耀发现象进行预测或分类。在由地基广角相机阵(Ground based Wide Angle Camera,GWAC)记录到的约791万条的星等变化时间序列数据集上,耀发现象正样本仅有几十条
学位