论文部分内容阅读
随着图数据规模的不断增长和属性因素的不断增加,路径查询技术面临如何解决属性自身的繁杂性、属性之间关系的复杂性以及图数据的大规模等问题。这些问题导致现有很多路径查询算法不能满足实际的需求,所以复杂多属性的路径查询引起了人们的关注。本文以复杂多属性尤其是不确定的模糊属性路径的综合评价和大规模图数据的查询优化为重要的创新支点,在总结现有理论和技术的基础上,围绕路径可达性、最优路径和TOP-K路径三个方面展开工作。 图数据的可达性查询是基本的路径查询问题,但在大规模复杂多属性的需求下,以往的算法显然已不能满足路径可达性查询的需要。为解决这个问题,本文提出了TCRQDG算法。首先针对图数据可达性查询的许多算法很少同时关注节点和边的因素,利用虚拟节点技术对图进行扩展的方法,从而对节点和边的信息进行综合考虑和评价;其次,针对大规模图数据,提出用筛选技术剔除不符合条件的路径进而实现图精简的方法,减少了查询时边的数量;第三,针对单一属性的路径查询结果不能满足决策用户多属性的要求的情况,分析和研究了属性间的关联关系,提出主成分分析的方法对路径各个属性的权重进行评价研究;第四,针对路径属性值具有不同类型和特点的情况,基于复杂多属性决策的技术,提出对每条路径进行综合评价方法;第五,针对路径信息的完整性,设计了环收缩技术,以确保边的连接信息不丢失;第六,在对比分析大规模可达性查询技术的基础上,提出筛选的多间隔标签技术实现源节点到目的节点之间的查询;最后,经过实验的性能分析和证明,本文所提出的方法的确能解决复杂多属性的可达性查询。 图数据的最优路径查询是路径查询的另一个基本问题。但随着数据规模的不断增大,路径含有的不确定性属性也越来越多,如何处理这些属性和数据的规模是最优路径查询所面临的新问题。本文针对确定性和不确定性的混合数据、纯语言值的两种属性情况,分别设计了两种算法解决最优路径的查询。第一种算法针对复杂多属性中确定性和不确定性等不同类型和特点的属性相混合的情况,利用信息熵技术和主观赋权法分别求出了路径各个属性的客观权重和主观权重,然后综合分析两种权重算出各个路径的综合得分;其次,在路径综合得分的基础上,针对大规模图数据的时间和空间的需求,提出用图的分解和层次收缩技术减少最优化路径查询时的搜索空间,利用双向搜索技术加速了查询的过程;最后,经过对实验结果的分析,本文提出的算法能解决好混合属性的最优化路径查询。第二种算法基于路径查询形式的多样化前提下,针对心理倾向性等语言值属性的不确定性给路径查询造成的困难,本文综合考虑决策用户对路径的偏好和对路径属性的偏好等复杂情况,基于偏差函数和多目标优化技术相结合技术得到语言属性的权重,并利用LWAA技术分别解决了单决策用户和多决策用户的路径综合评价问题;其次,针对大规模的图数据,本文改进了地标和社团技术,优化了路径的查询,提高了查询的效率;最后,经过对实验结果的分析,本文的算法能有效的实现纯语言值属性的最优化路径查询。 图数据的TOP-K路径查询是最优路径查询的扩展,它为人们提供了多条备选路径。但随着决策用户需求的不断增长,TOP-K路径查询同样也面临大规模和复杂多属性的影响。本文分析了当前常用TOP-K路径算法的优势与不足,并在考虑图数据中属性的不同类型和特点前提下,分别用三种不同方法解决了面向三种不同属性类型的TOP-K路径查询问题。第一种方法首先针对属性中精确值和不确定值相混合造成的路径综合评价困难,在分析了间隔数的特点后,提出用极值和TOPSIS技术对每个路径进行综合评价;其次,经过分析,计算TOP-K路径的偏离路径算法的核心是Dijkstra算法,而且要多次调用,这就产生了一个瓶颈,为了提高查询的效率,本文提出用图数据分解和双向搜索技术优化偏离路径算法;最后经过实验分析,本文的算法实现了混合属性的TOP-K路径查询。第二种方法首先分析了影响实际交通的各个属性,针对很多属性都具有模糊性的特征,以路径的模糊属性为研究对象,利用隶属度函数、合成算子等模糊决策技术对每条路径进行评价;其次,针对大规模图数据的情况,提出遗传算法和偏离路径算法相结合的技术实现了TOP-K路径的查询;最后,经过实验和性能分析,本文所提的模糊多属性的遗传算法的确能解决模糊属性的TOP-K路径查询;第三种算法首先分析了决策用户的犹豫模糊语言集,因为这种语言集反映了决策用户思维的模糊性和路径的复杂性,所以本算法针对这些特点,用信息熵技术和主观赋权法分别得到各个属性的客观权重和主观权重,提出用极值技术改进TOPSIS等技术,实现了每个犹豫模糊语言集影响的路径综合评价问题;其次,针对大规模的图数据,基于优先队列改进地标、社团的技术,实现TOP-K路径的查询;最后,经过实验和性能分析,本文所提的算法的确能解决犹豫模糊语言属性的TOP-K路径查询。