面向图数据的复杂多属性路径查询技术研究

来源 :大连理工大学 | 被引量 : 3次 | 上传用户:bittercoffee456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图数据规模的不断增长和属性因素的不断增加,路径查询技术面临如何解决属性自身的繁杂性、属性之间关系的复杂性以及图数据的大规模等问题。这些问题导致现有很多路径查询算法不能满足实际的需求,所以复杂多属性的路径查询引起了人们的关注。本文以复杂多属性尤其是不确定的模糊属性路径的综合评价和大规模图数据的查询优化为重要的创新支点,在总结现有理论和技术的基础上,围绕路径可达性、最优路径和TOP-K路径三个方面展开工作。  图数据的可达性查询是基本的路径查询问题,但在大规模复杂多属性的需求下,以往的算法显然已不能满足路径可达性查询的需要。为解决这个问题,本文提出了TCRQDG算法。首先针对图数据可达性查询的许多算法很少同时关注节点和边的因素,利用虚拟节点技术对图进行扩展的方法,从而对节点和边的信息进行综合考虑和评价;其次,针对大规模图数据,提出用筛选技术剔除不符合条件的路径进而实现图精简的方法,减少了查询时边的数量;第三,针对单一属性的路径查询结果不能满足决策用户多属性的要求的情况,分析和研究了属性间的关联关系,提出主成分分析的方法对路径各个属性的权重进行评价研究;第四,针对路径属性值具有不同类型和特点的情况,基于复杂多属性决策的技术,提出对每条路径进行综合评价方法;第五,针对路径信息的完整性,设计了环收缩技术,以确保边的连接信息不丢失;第六,在对比分析大规模可达性查询技术的基础上,提出筛选的多间隔标签技术实现源节点到目的节点之间的查询;最后,经过实验的性能分析和证明,本文所提出的方法的确能解决复杂多属性的可达性查询。  图数据的最优路径查询是路径查询的另一个基本问题。但随着数据规模的不断增大,路径含有的不确定性属性也越来越多,如何处理这些属性和数据的规模是最优路径查询所面临的新问题。本文针对确定性和不确定性的混合数据、纯语言值的两种属性情况,分别设计了两种算法解决最优路径的查询。第一种算法针对复杂多属性中确定性和不确定性等不同类型和特点的属性相混合的情况,利用信息熵技术和主观赋权法分别求出了路径各个属性的客观权重和主观权重,然后综合分析两种权重算出各个路径的综合得分;其次,在路径综合得分的基础上,针对大规模图数据的时间和空间的需求,提出用图的分解和层次收缩技术减少最优化路径查询时的搜索空间,利用双向搜索技术加速了查询的过程;最后,经过对实验结果的分析,本文提出的算法能解决好混合属性的最优化路径查询。第二种算法基于路径查询形式的多样化前提下,针对心理倾向性等语言值属性的不确定性给路径查询造成的困难,本文综合考虑决策用户对路径的偏好和对路径属性的偏好等复杂情况,基于偏差函数和多目标优化技术相结合技术得到语言属性的权重,并利用LWAA技术分别解决了单决策用户和多决策用户的路径综合评价问题;其次,针对大规模的图数据,本文改进了地标和社团技术,优化了路径的查询,提高了查询的效率;最后,经过对实验结果的分析,本文的算法能有效的实现纯语言值属性的最优化路径查询。  图数据的TOP-K路径查询是最优路径查询的扩展,它为人们提供了多条备选路径。但随着决策用户需求的不断增长,TOP-K路径查询同样也面临大规模和复杂多属性的影响。本文分析了当前常用TOP-K路径算法的优势与不足,并在考虑图数据中属性的不同类型和特点前提下,分别用三种不同方法解决了面向三种不同属性类型的TOP-K路径查询问题。第一种方法首先针对属性中精确值和不确定值相混合造成的路径综合评价困难,在分析了间隔数的特点后,提出用极值和TOPSIS技术对每个路径进行综合评价;其次,经过分析,计算TOP-K路径的偏离路径算法的核心是Dijkstra算法,而且要多次调用,这就产生了一个瓶颈,为了提高查询的效率,本文提出用图数据分解和双向搜索技术优化偏离路径算法;最后经过实验分析,本文的算法实现了混合属性的TOP-K路径查询。第二种方法首先分析了影响实际交通的各个属性,针对很多属性都具有模糊性的特征,以路径的模糊属性为研究对象,利用隶属度函数、合成算子等模糊决策技术对每条路径进行评价;其次,针对大规模图数据的情况,提出遗传算法和偏离路径算法相结合的技术实现了TOP-K路径的查询;最后,经过实验和性能分析,本文所提的模糊多属性的遗传算法的确能解决模糊属性的TOP-K路径查询;第三种算法首先分析了决策用户的犹豫模糊语言集,因为这种语言集反映了决策用户思维的模糊性和路径的复杂性,所以本算法针对这些特点,用信息熵技术和主观赋权法分别得到各个属性的客观权重和主观权重,提出用极值技术改进TOPSIS等技术,实现了每个犹豫模糊语言集影响的路径综合评价问题;其次,针对大规模的图数据,基于优先队列改进地标、社团的技术,实现TOP-K路径的查询;最后,经过实验和性能分析,本文所提的算法的确能解决犹豫模糊语言属性的TOP-K路径查询。
其他文献
受限于单体锂电池的电压和容量,车用锂电池组常常需要将成百上千个单体锂电池串并联成组使用。但由于生产工艺的不一致性和使用过程环境的不一致性,单体电池间总是存在着无法消
人脸检测是指确定输入图像中是否存在人脸,以及存在的具体位置的过程。随着智能化的发展,人脸检测技术在智能交互、身份核验、移动社交等领域应用越来越广泛。然而非限制条件下,人脸并非总是呈现清晰完整的正面形象,因遮挡、角度、分辨率等各种因素导致的不完备信息的人脸图像,给人脸检测任务带来了巨大的挑战。当前虽然已有许多算法在人脸检测上取得了较好的效果,但在处理不完备信息人脸方面仍然存在不足。本文针对遮挡和小尺
学位
人脸识别因其重要的科学意义和实用价值而成为当前模式识别领域的一个研究热点。在过去几十年中,学者们提出了许多相关的特征提取方法,比如线性鉴别分析(LDA)、主成分分析(PCA)和保
作为传统DoS(Denialof Service)攻击的改进,LDoS(Low-rate DenialofService)攻击具有相当的危害性且更强的隐蔽性。由于LDoS攻击的高隐蔽性特征,传统的DoS攻击检测方法已无法对其进
随着各种数据来源和数据采集方式的逐渐多样化,机器学习和数据挖掘技术的应用场景日益丰富。机器学习研究的本质要解决智能化学习的基础表示和模型两大问题,前者需要对计算机可
人工智能是计算机模拟人脑的一种智能行为,它一方面对人类智能工作方法的基本步骤进行归纳,另一方面又创造了适合计算机运行的步骤,使计算机具有了与人类智能相似的能力和技
学位
模板匹配广泛应用于图像处理及信号处理领域。科学技术的飞速发展使得图像模板匹配处理的规模越来越大,更重要的是人们对实时图像处理的需求也越来越高,因此,采用通用处理器来实
云计算技术虽然是一种新兴技术,但一经提出就得到迅速发展,凭借自身的优势得到了越来越多国家企业和研究机构的关注,很多研究人员投入到云计算相关技术的研究中伴随着云计算研究
Web系统通常部署于开放的互联网环境,用户输入的随意性对系统的安全验证机制提出了更高的要求。因此检测程序中是否存在有效的安全验证机制成为软件测试领域的重要研究内容。