论文部分内容阅读
空间索引技术是空间数据库领域中的一个重要的研究内容,索引的性能将直接影响数据库的性能,且数据的检索和查询是应用最多的操作,为了提高查询的速度,必须建立高效的空间索引结构支持相关的操作,空间索引技术经历了多年的研究和发展,形成了一套较完整的体系结构,但由于空间数据的海量性、复杂性和多样性的特点,对索引结构提出了更高的要求,对空间数据库中索引结构的研究成为一个研究的热点问题,如何建立高效的索引结构、提出有效的查询处理算法是迫切的研究课题。本文从空间索引的建立和基于索引的空间对象查询两个方面进行了研究,提出了一些较为有效的解决方法。针对现有的索引方法不能较好的保持空间数据的映射相关性,相邻的空间对象不能存储在索引中相近的结点上,引入了批量加载的方法对数据进行预处理,在分析影响空间索引性能的指标因素的基础上,对相对变化不多的静态数据,提出了一种静态的批量加载方法,减少索引覆盖区域的大小,通过实验对算法进行了验证,实验结果表明,提出的方法获得较好的空间利用率,性能较以前算法有了改善和提高。空间索引结构要随着数据进行动态的调整,动态索引结构的创建本质是聚类问题。对已有的聚类算法的分析,引入基于网格和密度的聚类算法对数据进行聚类,改进了原有聚类算法中的一些缺陷,将对象按照聚簇进行划分,通过两级的索引机制进行组织索引,每个聚簇都建立各自的索引结构,通过全局的R树索引结构建立整个索引,实验结果表明,提出的算法进一步提高了索引的时间和空间复杂度。针对现有的基于方向关系模型的查询处理过程,在过滤阶段不能获得较好的过滤结果,导致求精步骤的时间复杂度较高。根据对象MBR之间的方向关系的定义,在过滤和求精步骤之间插入一个中间步骤,根据参考对象落在空间区域的不同划分,判断目标和参考对象的方位关系,通过对所有的可能组合的情况进行分析,给出了解决方法,实现了更好的过滤候选对象目的,减少进入求精步骤的数据对象,从而提高了基于方向关系的查询速度。通过实例对提出的方法进行了分析,性能有了很大的提高,证明了算法的有效性,又通过实验进行验证,实验结果表明,算法在查询时间和I/O访问上均都有了提高。针对在近邻查询中参考对象被简化为一个点,使得查询的结果受到一定程度的影响,且现有的k近邻的查询算法不能很好的处理对象之间近邻查询的问题。提出了基于等距离线的k近邻查询算法,给出了更准确的过滤边界值和对象之间的距离定义,提出了新的剪枝策略,减少了计算实际对象距离的计算量,通过实例和实验对算法进行了分析和验证,分析的结果表明,算法有较好的过滤性能,能够提高基于对象的k近邻查询效率,进一步提高了算法在时间和空间上的性能。