论文部分内容阅读
随着对地观测技术的飞速发展,以及用户对空间数据访问需求的日益增长,基于关系数据库的空间数据库面临高并发读写、数据的高效存储与访问等一系列瓶颈问题。作为一种重要的空间数据,矢量地理数据具有更复杂的数据结构,对其进行合理组织和管理面临着更大的挑战。鉴于关系数据库面临的困境,NoSQL(Not Only SQL)数据库迅速崛起,由于摒弃了关系数据库的ACID数据模型,事务一致性及范式约束等,NoSQL数据库在很大程度上解决了关系数据库面临的诸多挑战,成为新兴数据库领域的国际前沿和热点并获得广泛关注与研究。论文在国家科技基础条件平台“地球系统科学数据共享平台——长江三角洲科学数据共享平台”的支持下,以NoSQL、空间数据库、形式语言与自动机理论为指导,研究面向多源键值数据库的矢量地理数据引擎。键值数据库是NoSQL数据库的重要类型,其访问接口简单,扩展性好,是当前面向大数据管理的主流数据库。但不同键值数据库拟解决的问题不同,各有优势,如何能在不同场景选择合适的键值数据库,并使用统一的方式进行透明访问,同时保持底层键值数据库的优势,是将多源键值数据库应用于矢量地理数据组织和管理亟待解决的问题。论文提出面向多源键值数据库的矢量地理数据库引擎,主要研究内容如下:(1)依据OGC (OpenGIS Consortium)简单要素模型,结合键值数据库的数据存储管理机制,设计了键值型矢量地理数据库分级组织模型,分析了各级元数据、索引信息、要素信息在不同键值数据库中的存储方法,研究了矢量地理数据逻辑模型与物理模型的映射机制。(2)设计了键值型矢量地理数据引擎的可伸缩框架结构。该框架结构底层为多源键值数据库访问层,通过多源键值数据库的特征接口和数据访问映射策略,既屏蔽了异构键值数据库的差异性,又发挥了各自的独特优势。中间层为矢量数据访问层,结合空间索引和分级组织模型,通过键值数据库访问层实现了矢量地理数据的查询和访问。引擎上层为GSQL (Geographical Structured Query Language)解释层,基于形式语言与自动机理论,按照词法分析,语法分析及语义分析的流程实现GSQL的解释。(3)基于上述研究,实现了面向多源键值数据库的开放式、可伸缩、易扩展的矢量地理数据引擎原型。原型系统集成了多种键值数据库,支持多种空间索引并提供声明式的GSQL访问支持。与关系型空间数据库Oracle Spatial的对比实验表明,基于多源键值数据库的矢量地理数据引擎能充分发挥底层键值数据库的优势,在响应速度与并发性能等方面明显优于传统的关系型空间数据库。