论文部分内容阅读
近年来GIS技术获得了迅猛发展,已广泛应用于公共管理,科学研究和商业领域。地理信息系统已经成为当前相关领域中一个十分活跃的研究课题。地理信息数据量日趋海量化,海量空间数据的处理需要通过空间存储技术提高处理效率。由于空间数据本身的复杂性,以及海量数据查询的要求日益提高,使得研究高效的空间索引技术成为GIS领域中一项重要的课题。 本文首先综述了地理信息系统和空间索引技术研究方面的一些最新工作,描述了空间数据的特征,对该研究开展以来所提出的主要空间索引技术进行了比较、分析和分类阐述。并讨论了空间索引算法的改进和设计思路。 由于目前已有的空间索引算法难以权衡空间存储效率和算法操作时间效率之间的矛盾。因此,本文综合区域分割原理和面向对象的分割原理的优点,提出了一种新的基于粗分网格和聚类R树的混合空间索引算法(HSIBGR)。该算法将研究区域划分为若干大网格建立一级索引,针对每个网格建立基于R树的二级索引。通过两级索引机制有效地节省了存储空间,同时将空间对象的操作限制在局部范围内,减少了空间对象的操作时间。 在进行R树结点分裂时,根据空间对象聚集分布的特性,提出了一种基于聚类技术的R树结点分裂算法(C-Linear),进一步优化了空间数据的组织,有效地提高了索引效率。 接着,本文将C-Linear算法加入到HSIBGR索引中,详细讨论了HSIBGR空间索引的插入、删除和查询操作。 最后,采用C++设计了C-Linear算法和HSIBGR算法,并用随机函数产生多种应用场景,将C-Linear算法和包含C-Linear的HSIBGR算法以及Guttman的R树算法和R树二次结点分裂算法在Linux系统下进行了模拟实验,通过对性能指标的比较和分析,结果表明HSIBGR算法的效率要高于Guttman的R树算法的效率,C-Linear算法的有效性要比R树二次结点分裂算法的有效性好。