论文部分内容阅读
随着移动设备的不断普及,基于空间位置的查询服务已经逐渐渗入到人们生活的方方面面。无论是从欧式空间的查询研究到路网环境下的查询研究,还是从静态对象的查询研究到移动对象的查询研究,空间数据库查询已变得越来越多样化和复杂化。聚集最近邻(Aggregate Neareast Neighbor, ANN)查询作为一种基于位置服务的空间查询技术,已经成为当前的一个研究热点问题。ANN查询检索的是到多个查询点距离的聚集函数值最小的目标对象,其查询结果依赖于确定的聚集函数。目前,ANN查询已经存在不少的研究成果,主要包括欧式空间和路网环境两个方面的研究,然而现有的路网环境下ANN查询算法存在空间检索范围大以及距离计算冗余多的问题。针对这些不足,本文首先提出了一种基于影响区域的ANN查询算法。考虑到大量查询位置同时发起查询请求且要求查询结果能够及时反馈的实际需求,本文接下来提出了一种基于影响区域的快速ANN查询算法。首先,分析了ANN查询本身的一些特性,并总结了网络Voronoi图在网络空间中计算距离的优势,引入了影响区域的基本概念,并且给出了相应的构建算法。接着,通过对基于Voronoi图的ANN查询算法的深入分析,本文给出了一种基于影响区域的ANN查询算法。该算法将Voronoi图和影响区域相结合,在缩小查询空间范围的同时也大大减少了距离的计算。而后,用真实的数据集分别对sum聚集函数和max聚集函数做了对比实验。实验验证了基于影响区域的ANN查询算法比基于Voronoi图的ANN查询算法具有更高的效率。最后,针对大量查询点数据的处理需求,引入了查询分组和查询代表点相关概念,并给出了一种基于影响区域的快速ANN查询算法。该算法是以牺牲查询结果的准确率来达到提高查询速度的目的。实验给出了查询分组和组内包含的查询点个数对该算法性能的影响。本文针对现有ANN查询算法中存在的不足,创新地提出了基于影响区域的ANN查询算法,从而能够获得较高的查询效率。另外,又以现实需求为驱动,给出了基于影响区域的快速ANN查询算法。总之,本文提出的ANN查询算法是对现有查询算法的改进。