论文部分内容阅读
随着云计算、物联网应用的普及,更多的传感设备、移动终端接入到网络,由此产生的地理空间数据及其增长速度将比历史上的任何时期都要多,都要快。从这些越来越庞大、复杂的空间信息资源中,快速高效地查询出所需信息,已成为衡量当前空间数据库性能的重要指标之一。传统的单节点关系型空间数据管理方式难以满足对于大数据量空间数据查询的高性能需求,特别是高性能的复杂空间多表连接任务需求。 为了解决这一问题,本文设计并实现了一种基于Massive parallel processing(MPP)架构的并行空间数据库中间件原型系统。系统充分利用无共享(shared-nothing)架构的优势,设计了语义解析器、并行空间数据划分与导入、并行空间多表连接、空间数据查询优化等算法与模型,基于调度的多线程通信模型,较好地解决空间数据库并行化处理海量数据的问题。文中,首先介绍了近年来国内外在海量空间数据存储和处理方面的研究现状。随后,对于GIS与并行处理的技术结合做了介绍;之后,阐述了基于MPP架构的并行空间数据库系统的系统架构以及各个模块和优化策略。最后,笔者进行了一些大规模数据量的查询实验,并对其查询结果进行了分析。实验结果表明,该系统在处理挖掘大规模数据量时,有着近似线性的加速比,能够充分提高海量空间数据的复杂查询的性能。