论文部分内容阅读
2005年1月国务院副总理曾培炎在国土资源部视察工作后,提出了“金土工程”,指出了国土资源信息化的重要性,而地学数据仓库则是它的一个重要研究方向。
近年来,随着“数字地球”和“数字国土”战略的提出和实施,大量的基础性数据库已接近完成,数据正以几何级数的速度增长,数据的管理与使用变得日益复杂;同时,地学的多学科交叉趋势也日益明显,传统的单主题数据库已难以满足多学科综合研究的需要,因此,如何将地学领域不同类别不同比例尺的海量数据进行集成,以适应地学数据的综合分析处理,便成为一个突出的问题。
然而,由于地学数据所固有的海量、多类别、多分辨率、多格式等特点,使地学数据集成的研究十分困难。传统的数据库技术难以解决海量多类别数据集成的问题,但近年来计算机领域新发展的数据仓库技术可为这一问题提供解决思路。
目前,数据仓库在数据格式单一的商业领域已应用得比较成熟,但在地学领域的研究还处于初步阶段,涉及多源多比例尺多格式的地学数据集成的研究有待于突破。
从现有研究情况来看,目前地学领域的数据仓库还是没有摆脱现有商业数据仓库基于时间的数据组织形式,因而在地学(特别是地质)领域有3个主要问题难以解决:
(1)不同类别数据集成。商业数据可以按时间集成,而地学数据按时间集成就比较难,特别是不同类别不同格式的数据集成更为困难。
(2)分级存储。海量数据往往需要根据数据粒度的大小来进行分级和分布式存储,如果地学数据以时间来组织的话,就难以确定数据的粒度,也就没有分级存储的依据。
(3)数据的综合分析。对地学矢量和栅格数据的分析,主要侧重于空间方面的综合性分析,而以时间为主的数据组织形式显然与此不太谐调。
而地学数据仓库是一个用以更好地支持地学决策分析处理、面向主题、集成的、能存储空间数据、随空间不断变化的地学数据集合。它集成了计算机科学、数据库技术、空间分析技术、GIS和RS等技术,在空间数据存储、管理、分析、利用等方面有着传统GIS和遥感软件所无可比拟的优势。
论文共分为7章三部分:
第一部分为第一章,是论文的选题部分,包括本文的选题来源、目的、意义和选题的国内外研究现状、发展趋势及存在问题。
第二部分包括第二、三、四、五、六章,主要包括地学数据仓库模型、地学数据仓库关键技术研究、Oracle Spatial空间应用技术、GDWMS系统在地学数据仓库三层架构中的理论和技术研究、GDWMS系统。
本文的第三部分是第七章,介绍论文的结论、主要工作、创新点和下一步的工作建议。
地学数据仓库是很新的研究领域,目前没有一个成熟的模型和产品,它在理论、技术和方法等很多方面还不成熟。本文在构建地学数据仓库和开发GDWMS系统过程中,涉及到众多的理论和应用技术。取得了以下认识和结论:
(1)地学数据仓库理论是不断发展的。
虽然目前地学数据仓库的三层架构,明确了各层间数据的来源和流向,但地学数据仓库是个庞大的系统工程,上述思想只是个大体框架。作者结合地学特点和数据仓库技术,提出了地学数据仓库模型和该模型所对应的数据流程。该模型是建立地学数据仓库的基础,也是GDWMS系统架构的指导思想。
通过深入的研究了地学数据仓库的特点、组织、结构功能特征和数据流程,提出了地学数据仓库各层所涉及到的理论、方法和技术,丰富了地学数据仓库理论。
(2)地学数据仓库是多学科交叉的成果,涉及到学科众多,元数据、数据挖掘和空间索引技术则是不可或缺的。
文中介绍元数据的定义、作用和描述,深入分析了地学数据仓库与元数据的关系,元数据和GIS的关系。研究表明,元数据是地学数据仓库的存在和运行的基础,数据仓库中所有的存储结构、分析、管理和操作都是通过元数据来进行的。所以,数据仓库中元数据的构架好坏直接影响到数据仓库能否健康运行。
空间数据挖掘是地学数据仓库分析和输出的重要技术手段,空间数据挖掘同OracleSpatial相结合,利用Oracle Spatial函数和空间数据挖掘方法,能够发现空间数据中隐含的信息,为地学数据仓库的存储层空间数据分析提供了新的手段。
空间索引是地学数据仓库存储、分析、查询和管理的关键。文中通过Oracle Spatial空间拓扑分析和四叉树索引研究,得出结论,空间数据索引在地学数据仓库的存储层、分析层和表达层都有着极其重要的作用。
(3)oracle是功能强大、应用很广的数据库技术,Oracle Spatial是数据库技术和空间信息技术相结合的新兴空间存储、管理和分析技术。本文中的GDWMS就是以Oracle Spatial来存储、管理和分析空间数据。本文对Oracle Spatial的空间数据模型、存储模型、空间索引技术、元数据技术、数据挖掘技术进行了深入研究,分析了Oracle Spatial在处理空间数据方面的具体优势,并在构建地学数据仓库过程中,体现出这些优势。
本文对Oracle Spatial的空间数据模型、存储模型、空间索引技术、元数据技术、数据挖掘技术进行了深入研究,分析了Oracle Spatial在处理空间数据方面的具体优势。通过深入研究,发现Oracle Spatial并不能准确地表达空间数据的拓扑关系,故引入9交模型,使得拓扑分析的结果更准确完整。
(4)通过FME和Oracle Spatial技术的综合利用,实现了矢量空间数据集成。利用FME掌握的超过150多种GIS数据格式的核心技术,通过VB+FME组件的二次开发,实现了不同格式GIS数据的转换;把地学数据仓库的Oracle Spatial作为空间存储对象,保存FME的转换数据,实现了数据格式和空间的统一。这样,便于地学数据仓库的存储、分析、管理和查询。
(5)地学数据仓库涉及到众多技术,这些技术的综合利用能够解决比较复杂的问题。在GDWMS系统功能模块开发过程中,几乎每个模块都就用到了多种技术,从综合利用结果来看,效果是比较好的。例如,矢量数据的快速显示,用分层理论来指导快速显示框架;元数据技术定义显示数据表结构和显示设计的参数;数据挖掘确定显示的数据;空间数据索引限定了显示、加载和卸载范围。
(6)地学数据仓库的不同层次,所用到的理论和技术不同,深入分析各层所涉及的理论和技术有助于更好的实现地学数据仓库功能。
如GDWMS系统所对应的地学数据仓库存储层用到FME理论;分析层用到的空间面元拓扑关系分析、Oracle Spatial9交模型、Oracle Spatial线性四叉树理论、金字塔理论;表达层用到空间数据压缩、分层管理器理论、栅格数据快速显示技术,并进行了详细论述。
(7)根据地学数据仓库理论,结合Oracle Spatial技术,利用图形二次开发组件,能够开发出比较适合地学数据仓库理论和功能的系统。GDWMS根据地学数据仓库理论,设计系统三层架构,分别对应地学数据仓库的三个层,利用Oracle Spatial作为存储和分析对象,结合FME技术、编程技术、分层理论等相关技术和方法,能够比较好的完成地学数据仓库简单功能。
(8)总的来说,本文的总体的思路和构建地学数据仓库的过程为:
①分析数据仓库和地学数据仓库发展历史和现状。
②提出地学数据仓库模型,及该模型的数据流程。
③分析并深入研究地学数据仓库涉及到的技术。
④深入分析地学数据仓库涉及的理论。
⑤开发地学数据仓库系统——GDWMS系统;
⑥验证该模型和地学数据仓库理论。
⑦得出结论。
从文中结论分析可以看出,GDWMS系统能够很好的结合地学数据仓库三层架构和地学数据仓库模型,从试验结果可以看出GDWMS系统能够解决较为复杂的地学问题。
总之,地学数据仓库是多领域、多学科交叉的成果,需要各行各业技术人员多年不辍劳作,同时它又是个应用领域广、结构复杂、面临的困难繁多的大型系统工程。作为地学新生事务,它在很多方面还有缺点和不足,还需要不断的改进,以使其在实际应用中更好的发挥作用。