论文部分内容阅读
随着空天地一体化的发展,地理数据的获取方式不断增多,各行各业积累的矢量数据的规模呈爆炸式增长,传统的集中式空间数据库已无法满足大规模矢量数据的管理需求。为此研究并构建支持多种空间数据库的高性能分布式矢量空间数据库,以满足不同应用场景对矢量大数据的分布式存储与高效并行查询处理的需求,具有重要的实际应用意义。本文围绕这一目标,对其中涉及的矢量数据存储组织模型、矢量数据划分策略以及分布式空间查询语言等关键技术展开了深入研究,并通过原型系统验证了研究内容的可行性。具体研究内容如下:(1)基于对象关系型空间数据库的分布式矢量数据存储组织模型设计。为满足分布式空间数据库中矢量数据的存储需求,本文在研究现有的矢量数据模型的基础上,结合分布式环境下的数据分布特征与分层分块的逻辑组织思想,并充分考虑对象关系型空间数据库管理系统在几何要素上的存储与查询处理优势,设计了基于对象关系型空间数据库的分布式矢量数据存储组织模型。(2)基于Hilbert排列码与跳跃一致性哈希的矢量数据划分策略研究。为提高矢量大数据集分布式存储与并行查询处理的效率,通过分析已有矢量数据划分方法的不足,提出了基于Hilbert排列码和跳跃一致性哈希的矢量数据划分策略,该策略能够按需构建矢量数据块,并可依据服务节点的性能分配数据量,同时还顾及了系统扩展节点时所产生的数据迁移问题。(3)分布式空间查询语言DGSQL3的设计。通过对比分析不同对象关系型空间数据库在查询语言方面的差异,同时结合分布式查询的特点,设计并实现了一种分布式空间查询语言DGSQL3,为构建支持多种空间数据库(PostGIS、MySQL Spatial、SQLServerSpatial)的分布式矢量空间数据库提供了全局统一查询访问接口。(4)原型系统实现与性能测试。基于上述关键技术,设计并构建了分布式矢量空间数据库原型系统,利用该原型系统对各关键技术的有效性与相关性能进行测试。结果表明,基于本文关键技术构建的分布式矢量空间数据库,能够实现对矢量大数据集的分布式存储和高效并行查询处理,支持对异构空间数据库的统一查询,并且在多核异构环境下仍具有较高的负载均衡性和可扩展性。