论文部分内容阅读
摘要:分布式应用有着可扩展性、可配置性、灵活可靠性及跨平台等优点。随着Oracle空间数据处理功能以及GIS软件的不断完善,采用分布式数据库技术解决地理信息系统中大量的空间图形数据的问题是行之有效的。本文以mapinfo为例,详细地说明了基于Oracle的地理信息系统数据库的分布式设计与实现方案,包括系统体系结构设计、系统功能设计、分布数据存储与管理,最后给出了展望。
关键词:分布式数据库;地理信息系统;Oracle;分布式地理信息系统
1、概况
地理信息系统(Geographic Information System,GIS)是对地理空间数据进行输入、存储、检索、分析、建模、显示、输出等处理的计算机系统。自从20世纪60年代世界上第一个GIS诞生以来,GIS得到了迅速发展,广泛地应用在地质、农业、城市建设、商业、军事等领域,取得了良好的经济效益和社会效益。
分布式数据库系统(Distributed Data Base,System DDBS)是由若干个站集合而成的,这些站又称为节点,它们在通讯网络中连接在一起,每个节点都是一个独立的数据库系统,它们又拥有各自的数据库中央处理器、终端,以及各自的局部数据库管理系统,因而分布式数据库系统可以看成一系列集中式数据库系统联合,它们在逻辑上属于同一系统,但在物理结构上是分布的。它具有以下优点:
(1)有利于改善性能。大部分数据库可以就地访问,减少通信开销,避免集中式数据库的瓶颈问题;
(2)扩充性好。可以根据发展的需要增减节点。或对系统重新配置,比集中式数据库灵活;
(3)可用性好。系统部分失效后,完好的部分仍可以继续运用。如果采用冗余技术,还可以获得一定的容错能力;
(4)自治性好。可以分散管理,统一协调,各个部门的用户总是希望拥有自己的数据,管理自己的数据,同时又想共享其它部门的有关数据,分布式数据库比较好的满足了用户的这些要求。
分布式数据库技术被应用到GIS这样的特定的领域中,出现了空间数据库(分布式GIS数据库系统),空间数据能够用于表示物体的位置、形状、大小和分布特征等诸方面信息,适用于描述所有二维、三维和多维分布的关于区域的现象,是地理系统的基础和核心。用关系数据库与空间数据库协同管理地理信息数据,是近年来地理信息系统分布式处理的常用方法之一,其分布式实现主要依赖于关系数据库(如Oracle)所提供的分布式功能。
分布式地理信息系统(Distributed GIS,DGIS)是指以分布式计算理论和计算机网络技术为基础,在计算机网络环境下实现地理数据采集、存储、管理、分析、表现等功能的地理信息系统。现有分布式地理信息系统的应用从低级到高级分为七种类型:原始数据下载、静态图像浏览、元数据目录浏览、动态图像浏览、基于Web的GIS查询和分析及智能网络型地理信息系统。
目前,分布式地理信息系统的实现主要基于三种分布式计算技术:对象管理组织(0MG)的CORBA技术、微软公司的DCOM技术和SUN公司的EJB技术。它们是当前分布式软件技术的代表,三者均有自己的特点和优势,为分布式GIS的设计、开发和广泛应用提供了基本的技术保证。
2、中国生态信息系统研究网络GIS系统数据特征
中国生态系统研究网络(CERN)是由分布于全国的36个生态系统定位研究站、5个学科分中心和1个综合研究中心组成的生态系统研究网络,组建于1988年。其目的是在大尺度上进行长期的生态和环境监测研究。
2.1海量性
中国生态系统长期动态监测数据库包括中国典型生态系统,即农田生态系统、森林生态系统、草地生态系统、湖泊生态系统和海湾生态系统共29个定位生态站上进行的水环境、土壤环境、大气环境、生物环境等方面的长期定位监测数据。
中国生态系统数据具有显著的空间特征,丰富的自然属性,以及较强的时态性。例如就森林而言,除了森林的空间位置,还涉及到森林生态系统土壤水分常数表、中子仪测量的各生态站森林土壤体积含水量和土层储水量、9个森林生态站的土壤含水量、雨水、地下水水质、地下水位、穿透降水量、树干径流量、穿透降水成分分析、树干径流成分分析、9个森林生态站的森林蒸散、森林内地表水径流量、森林枯枝落叶含水量、关于植物群落乔木层各种乔木的胸径、高度、生活型等的调查数据、森林植物群落乔木层、灌木层生物量模型、关于站区各种动物数量的调查数据、森林植物群落灌木层植物种组成、森林植物群落草本层调查(2003年以前)、记录站区生物群落中主要微生物的种类和名称、森林植物群落乔木层群落特征、记录站区发生的病虫害和自然灾害的发生日期及危害情况、森林植物群落灌木层群落特征、植物群落凋落物回收量季节动态(2003年前)、记录综合观测场内灌木层的干重和模型、植物群落凋落物回收量季节动态(2004年后)、关于植物群落灌木层、草本层各种植物的盖度、多度、生活型等的调查数据、植物群落乔木层植物种组成(2004年后)、记录站区生物群落中主要野生动物的种类和名称、森林植物群落草本层植物种组成(2004年后)、森林生态系统地下水位记录表、2003年前中子仪土壤含水量平均值、2004年后森林烘干法土壤含水量表、2004年后森林地表径流量表、枯枝落叶含水量表、中子仪土壤含水量统计表、森林植物群落乔木层每木调查与生物量、关于站区植被、植物群落、地貌、水分、土壤、人类活动情况、动物活动情况、演替特征等的调查数据、森林水面日蒸发量数据表、森林土壤硝态氮和铵态氮动态、1999-2006年森林土壤容重、机械组成、微量元素和重金属元素、矿质全量、养分等。且生态数据种类繁多,数据的存储类型多样等,这些就构成中国生态信息系统得基础。对一个生态信息系统,应当具有管理、分析以及应用如此大量数据的能力。但目前对“海量”一词尚无统一的界定,一种观点认为,系统使用和管理的数据大于10000G时,在常规计划机上运行的数据库系统的运行效能明显下降。
2.2数据源具有分布性
中国生态系统分中心有五个分中心:水分分中心、土壤分中心、大气分中心、生物分中心、水域生态系统分中心组成。其下有14个农业生态系统研究站、9个森林生态系统研究站、2草原生态系统研究站、5个沼泽生态系统研究站、1个荒漠生态系统研究站、2个湖泊生态系统研究站、3个海湾生态系统研究站。这些分中心和站点分布在全国各地,且每一个站点都有自己的数据库,记录着大量的基础数据,各分中心有管理者自己辖区的数据采集、存储、管理等,当总站和分中心需要个站点的数据时,就可以通过远程网络来访问,因此没有必要建立一个集中数据库。
2.3数据访问
中国生态系统网络主要是以地面网络式观测、试验为主,结合RS、GIS系统和数学模型等手段,实现对中国各主要生态系统和环境状况的长期、全面的监测和研究。这些都需要分布式GIS数据库。表现在:
(1)科学研究中,不论是分中心还是个站点需要查询相关的图形和属性信息,都需要连接数据库;
(2)中心站点汇集各个站点收集到的数据需要访问数据库及数据库之间的操作;如果采用集中式数据库,如此频繁的数据访问和数据提取都通过远程网络来实现,影响个站点的日常办公效率,影响图形数据和属性数据的一致性,一旦网络出现故障,系统将崩溃,而使用分布式数据库,个站点和分中心只需要访问本地数据库。能保证数据的一致性和安全,提高办事效率。
3、分布式地理信息系统解决方案
分布式数据库的实现,主要基于数据的存储方式、数据的访问和更新模式,笔者在文中以中国生态系统网络中心的数据库的解决方案为例,对分布式数据库的实现方式进行了说明。3.1生态数据库的建库目标
建立中国统一的无缝生态数据库,该生态数据库包含了全国所有分中心、个站点的空间数据,包括个站点的位置,个站点取样植被的位置及其拓扑关系,还包括各分中心、站点的属性信息。并且这些数据植被类型、时间、气候等的变更而同步更新。通过该数据库,可以对各生态中心、站点的信息进行各种形式的查询和统计汇总,随时掌握各生态中心、站点的信息的详情,还可以为日常与生态有关科学研究提供图形和属性数据。
3.2系统软件结构
(1)操作系统采用微软的Windows NT Server4.0 +Windows NT/2000/XP系统;
(2)数据库采用Oracle10,用来存储所有与地籍相关的空间数据和非空间数据;
(3)系统采用B/S三层结构,服务器端采用Microsoft IIS4.0,客户端采用IE6.0;
(4)GIS系统采用hatergraph公司的Geomedia系统软件,Geomeclia Professional作为桌面 GIS系统,用以进行数据的编辑处理和管理,Geomeclia WebMap作为 GIS数据服务器,用来进行地籍数据的发布,以便在IE上进行浏览和查询、输出[2]。
3.3数据的存储方式
(1)各站点的生态数据库,存放本地的自己管理权限以内图形、图像数据和属性数据;
(2)分中心数据库存放需要由分中心办理的图形、图像数据和属性数据及一些统计和汇总数据;
(3)对于跨两个分中心的宗地,原则上在两个分中心的数据库中均要有记录。
3.4数据的管理方式
在早期的生态管理信息系统中,数据的存储方式主要是空间数据的文件方式管理和属性数据的关系数据库管理方式,在单机上取得了一定的成功,但随着生态管理信息化的发展和GIS在生态管理中的应用,空间数据的文件管理模式在实现数据共享、网络通信、进发控制及数据的安全恢复机制等方面出现了难以解决的问题。因此,在生态数据库的设计中,采取了空间数据和属性数据的全关系数据库管理方式,用关系数据库管理空间数据和属性数据。在数据库产品中,选取了Oracle10版本,因为它提供的空间数据管理工具Spatial Cartridge(SC)是一个真正的Client/Server机制的产品,提供了分布式处理能力、全部的Oracle安全管理机制、SQL方式访问空间数据等功能。基于这种模式下,可以实现数据的共享和分布式处理。
3.5数据的访问和更新模式
各生态站点将自己管理权限内图形、图像数据和属性数据存放在Oracle10数据库中,分中心数据库存放的是需要分中心办理的图形、图像数据和属性数据,一些统计和汇总数据。属性数据的访问和更新可以利用Oracle数据库提供的数据库链路、视图、快照等直接对属性数据进行透明访问和进行操作。而空间数据的访问和更新则利用SC提供的多记录多字段存储空间数据、支持数据复制、分布式空间数据和高速大批量数据调用、支持分批数据调用的功能来实现,这样,在个站点变更自己数据的同时,分中心数据库也能同步更新,总中心也能从分中心、个站点调用最新的数据。
4、系统体系结构设计
基于以上分析,可以根据实际条件及需要,设立多个站点进行数据采集及管理工作。理想情况下,每个站点采用C/S与B/S相结合的体系结构,如图1所示,C/S体系结构可以分为两层,也可以根据需要设计为三层或多层;B/S体系结构一般分为三层,即数据服务层、应用服务层及应用层。考虑到与已有数据库系统的集成、并保护现有的软件平台的投资,本系统采用微软的DCOM技术及Oracle10数据库。
4.1数据服务层
数据服务层为应用服务层提供所需的数据服务,包括空间数据、属性数据、管理数据、元数据等的存储及数据库连接组件。
4.2应用服务层
应用服务层是分布式GIS的核心,可以分为分布式服务和GIS应用服务两部分。分布式服务包括目录服务、注册服务、事件服务以及安全服务等,这些服务是建立分布式GIS的基础,可以通过DCOM的分布式服务进行扩展实现。GIS应用服务层是分布式GIS的应用核心。主要实现GIS的应用服务,如数据格式转换服务、GIS空间分析服务、数据获取服务等。可以根据数据量及访问的负载情况的不同,将GIS应用服务器设置在一台或多台机器上。
4.3应用层
应用层包括两种客户端,即C/S客户端及B/S客户端。C/S客户端需要安装GIS应用软件,实现对地图数据及属性数据的维护,进行空间分析、查询统计、决策支持等比较复杂的操作。B/S客户端需要安装浏览器及完成地图基本操作功能的ActiveX控件。
在这种体系结构下,生态系统网络平台上的不同站点之间很容易通过分布式数据库进行数据共享,或者通过Web服务器提供的数据下载功能得到其他站点的数据。
5、系统功能设计
生态系统管理的内容包括个站的位置及其所拥有的测量仪器,长期监测的植被类型的位置及相关的属性。及其相关的RS数据对植被类型可视化监测。系统的功能结构见图2。
(1)系统功能:包括单位信息管理、权限管理、日志管理、模版管理、原数据管理等;
(2)地图管理:提供对物理图层的管理,包括地图基本操作(如放大、缩小、漫游、定位、距离测量)、双向查询、图层管理、地图编辑、地图出版等;
(3)空间分析:包括切面分析和区域分析(如圆形、四边形、不规则区域、缓冲区)等;
(4)拓扑分析:包括连通性分析及最短路径分析等;
(5)网络资源:提供线路一级的管理,一条线路由线段及站等连接而成;
(6)统计报表:自动生成各种通信报表;
(7)数据接口:与上、下级单位及同级单位的数据交换接口,包括地图数据、属性数据及报表数据;
(8)业务管理:包括采集数据、对外经营业务等;
(9)web服务:基于web的地理信息查询及数据下载等服务。
6、分布式数据库设计
早期的GIS空间数据和属性数据是分离存储的,空间数据以文件的形式存储,属性数据则存储在关系数据库中。这种方式也称为混合结构模式,其弱点是空间数据与属性数据的一致性难以保持,GIS的开放性和互操作性受到限制,数据共享和并行处理没有保证。另一种方式是统一存储模式,即使用关系数据库管理系统(RDBMS)或面向对象的数据库管理系统(00DBMS)统一存储和管理空间数据及属性数据。对于大型分布式地理信息系统,应采用统一存储模式。
6.1空间数据的分幅与分层
分幅:由于各站点只能采集及维护自己管辖范围内的数据,最直接的方法就是按照站点辖区域对地理数据进行分幅,按照所管辖的地域及植被类型分别存储及维护自己的数据。在数据分别存储的同时,也可以根据需要进行一定程度的集中,如总站、分中心也可以同时存储下级站点及相邻站点的数据,但不鼓励过多地重复存储。
分层:地理信息系统是按照分层的思想组织地图数据的,一般情况下同一种植被类型组织在同一图层中。从管理及数据的安全性方面考虑,应使不同级别的同一种设备处于不同的图层。
6.2数据库组织
每一个站点上的数据库应包括:管辖区域的空间数据及属性数据、其他管理信息数据及元数据,并按层次组织在数据库中(图3),每一层的内容如下:
物理层包括空间数据及属性数据,为了支持规划设计,每个图层都具有一个状态属性,它可以是“运行态”、“在建态”或“规划态”,并支持从“规划态”到“在建态”再到“运行态”的转换。背景图层不需要经常更新和传输,以外部文件的方式存储,设备图层则应存储在数据库中。
逻辑层由多个物理层及物理层上不同对象之间的关系组成,如光纤网络由若干条光纤线路组成,而每一条光纤线路由若干条光纤段及光纤站连接而成管理信息层通常是MIS系统中需要管理的信息。
元数据层是对底层数据集的描述信息,对数据的内容、质量、数据量、采集方法和所有者等进行说明[5]。
7、C/S与B/S相结合的体系结构
在最高级别的管理单位实现C/S与B/S相结合的体系结构。C/S体系结构只能供处于局域网上的少数用户使用,只有实现了B/S体系结构,此系统才能为整个行业提供地理信息服务,如下级单位可以浏览通信网的概貌,可以对地图进行基本的操作,也可以进行数据下载及上传。
8、发展方向
基于行业的大型地理信息系统具有数据分布采集、维护以及集中使用的特点。同一行业的不同部门之间需要进行数据共享及相互协作,不同行业之间往往也需要相互协作,因为不同行业的设备可能处于相同的地理空间。由于不同的系统所用的平台可能不同,数据格式多种多样,数据集中使用的技术难度很大,另外还有管理及其他方面的障碍。
分布式地理信息系统一直处在不断发展之中,其发展方向之一是朝着分布式服务体系结构或地理信息服务的方向发展,也称联合GIS,即建立分布式数据管理服务器对多个GIS站点进行统一管理,如图3所示。此体系结构支持企业间不同应用之间的互操作,可以采用基于XML和SOAP的Web Services框架来实现[6]。
在分布式服务体系结构的基础上,建立一套适应于地理信息服务的全新的框架体系,能够较好地解决目前所面临的不同系统之间的信息共享及互操作等问题。
随着计算机硬件、软件和宽带网技术的不断发展,笔者认为分布式技术必将更充分应用到生态信息系统的建设之中,传统的集中式的数据库管理模式将被分布式数据管理模式所代替。在大范围使用上,目前存在的主要问题是数据传输速度不够理想,一些功能还需要进一步完善。
参考文献:
[1]王能斌.数据库系统[M].北京:电子工业出版社,1995.
[2]史济民.数据库原理与应用[M]成都:成都电子科技大学出版社,1985.
[3]闫国年,张书亮,龚敏霞等.地理信息系统集成原理与方法[M].北京:科学出版社,2003.
[4]倪建立,孟令奎,王宇川等.电力地理信息系统[M].北京:中国电力出版社,2004.
[5]曹彦荣,何建帮.地理信息语义关系元数据研究及应用[J].计算机科学,2004,31(1):72—76.
[6]李建强,范玉顺.企业集成平台技术研究[J].计算机科学,2004,31(1):66-68.
关键词:分布式数据库;地理信息系统;Oracle;分布式地理信息系统
1、概况
地理信息系统(Geographic Information System,GIS)是对地理空间数据进行输入、存储、检索、分析、建模、显示、输出等处理的计算机系统。自从20世纪60年代世界上第一个GIS诞生以来,GIS得到了迅速发展,广泛地应用在地质、农业、城市建设、商业、军事等领域,取得了良好的经济效益和社会效益。
分布式数据库系统(Distributed Data Base,System DDBS)是由若干个站集合而成的,这些站又称为节点,它们在通讯网络中连接在一起,每个节点都是一个独立的数据库系统,它们又拥有各自的数据库中央处理器、终端,以及各自的局部数据库管理系统,因而分布式数据库系统可以看成一系列集中式数据库系统联合,它们在逻辑上属于同一系统,但在物理结构上是分布的。它具有以下优点:
(1)有利于改善性能。大部分数据库可以就地访问,减少通信开销,避免集中式数据库的瓶颈问题;
(2)扩充性好。可以根据发展的需要增减节点。或对系统重新配置,比集中式数据库灵活;
(3)可用性好。系统部分失效后,完好的部分仍可以继续运用。如果采用冗余技术,还可以获得一定的容错能力;
(4)自治性好。可以分散管理,统一协调,各个部门的用户总是希望拥有自己的数据,管理自己的数据,同时又想共享其它部门的有关数据,分布式数据库比较好的满足了用户的这些要求。
分布式数据库技术被应用到GIS这样的特定的领域中,出现了空间数据库(分布式GIS数据库系统),空间数据能够用于表示物体的位置、形状、大小和分布特征等诸方面信息,适用于描述所有二维、三维和多维分布的关于区域的现象,是地理系统的基础和核心。用关系数据库与空间数据库协同管理地理信息数据,是近年来地理信息系统分布式处理的常用方法之一,其分布式实现主要依赖于关系数据库(如Oracle)所提供的分布式功能。
分布式地理信息系统(Distributed GIS,DGIS)是指以分布式计算理论和计算机网络技术为基础,在计算机网络环境下实现地理数据采集、存储、管理、分析、表现等功能的地理信息系统。现有分布式地理信息系统的应用从低级到高级分为七种类型:原始数据下载、静态图像浏览、元数据目录浏览、动态图像浏览、基于Web的GIS查询和分析及智能网络型地理信息系统。
目前,分布式地理信息系统的实现主要基于三种分布式计算技术:对象管理组织(0MG)的CORBA技术、微软公司的DCOM技术和SUN公司的EJB技术。它们是当前分布式软件技术的代表,三者均有自己的特点和优势,为分布式GIS的设计、开发和广泛应用提供了基本的技术保证。
2、中国生态信息系统研究网络GIS系统数据特征
中国生态系统研究网络(CERN)是由分布于全国的36个生态系统定位研究站、5个学科分中心和1个综合研究中心组成的生态系统研究网络,组建于1988年。其目的是在大尺度上进行长期的生态和环境监测研究。
2.1海量性
中国生态系统长期动态监测数据库包括中国典型生态系统,即农田生态系统、森林生态系统、草地生态系统、湖泊生态系统和海湾生态系统共29个定位生态站上进行的水环境、土壤环境、大气环境、生物环境等方面的长期定位监测数据。
中国生态系统数据具有显著的空间特征,丰富的自然属性,以及较强的时态性。例如就森林而言,除了森林的空间位置,还涉及到森林生态系统土壤水分常数表、中子仪测量的各生态站森林土壤体积含水量和土层储水量、9个森林生态站的土壤含水量、雨水、地下水水质、地下水位、穿透降水量、树干径流量、穿透降水成分分析、树干径流成分分析、9个森林生态站的森林蒸散、森林内地表水径流量、森林枯枝落叶含水量、关于植物群落乔木层各种乔木的胸径、高度、生活型等的调查数据、森林植物群落乔木层、灌木层生物量模型、关于站区各种动物数量的调查数据、森林植物群落灌木层植物种组成、森林植物群落草本层调查(2003年以前)、记录站区生物群落中主要微生物的种类和名称、森林植物群落乔木层群落特征、记录站区发生的病虫害和自然灾害的发生日期及危害情况、森林植物群落灌木层群落特征、植物群落凋落物回收量季节动态(2003年前)、记录综合观测场内灌木层的干重和模型、植物群落凋落物回收量季节动态(2004年后)、关于植物群落灌木层、草本层各种植物的盖度、多度、生活型等的调查数据、植物群落乔木层植物种组成(2004年后)、记录站区生物群落中主要野生动物的种类和名称、森林植物群落草本层植物种组成(2004年后)、森林生态系统地下水位记录表、2003年前中子仪土壤含水量平均值、2004年后森林烘干法土壤含水量表、2004年后森林地表径流量表、枯枝落叶含水量表、中子仪土壤含水量统计表、森林植物群落乔木层每木调查与生物量、关于站区植被、植物群落、地貌、水分、土壤、人类活动情况、动物活动情况、演替特征等的调查数据、森林水面日蒸发量数据表、森林土壤硝态氮和铵态氮动态、1999-2006年森林土壤容重、机械组成、微量元素和重金属元素、矿质全量、养分等。且生态数据种类繁多,数据的存储类型多样等,这些就构成中国生态信息系统得基础。对一个生态信息系统,应当具有管理、分析以及应用如此大量数据的能力。但目前对“海量”一词尚无统一的界定,一种观点认为,系统使用和管理的数据大于10000G时,在常规计划机上运行的数据库系统的运行效能明显下降。
2.2数据源具有分布性
中国生态系统分中心有五个分中心:水分分中心、土壤分中心、大气分中心、生物分中心、水域生态系统分中心组成。其下有14个农业生态系统研究站、9个森林生态系统研究站、2草原生态系统研究站、5个沼泽生态系统研究站、1个荒漠生态系统研究站、2个湖泊生态系统研究站、3个海湾生态系统研究站。这些分中心和站点分布在全国各地,且每一个站点都有自己的数据库,记录着大量的基础数据,各分中心有管理者自己辖区的数据采集、存储、管理等,当总站和分中心需要个站点的数据时,就可以通过远程网络来访问,因此没有必要建立一个集中数据库。
2.3数据访问
中国生态系统网络主要是以地面网络式观测、试验为主,结合RS、GIS系统和数学模型等手段,实现对中国各主要生态系统和环境状况的长期、全面的监测和研究。这些都需要分布式GIS数据库。表现在:
(1)科学研究中,不论是分中心还是个站点需要查询相关的图形和属性信息,都需要连接数据库;
(2)中心站点汇集各个站点收集到的数据需要访问数据库及数据库之间的操作;如果采用集中式数据库,如此频繁的数据访问和数据提取都通过远程网络来实现,影响个站点的日常办公效率,影响图形数据和属性数据的一致性,一旦网络出现故障,系统将崩溃,而使用分布式数据库,个站点和分中心只需要访问本地数据库。能保证数据的一致性和安全,提高办事效率。
3、分布式地理信息系统解决方案
分布式数据库的实现,主要基于数据的存储方式、数据的访问和更新模式,笔者在文中以中国生态系统网络中心的数据库的解决方案为例,对分布式数据库的实现方式进行了说明。3.1生态数据库的建库目标
建立中国统一的无缝生态数据库,该生态数据库包含了全国所有分中心、个站点的空间数据,包括个站点的位置,个站点取样植被的位置及其拓扑关系,还包括各分中心、站点的属性信息。并且这些数据植被类型、时间、气候等的变更而同步更新。通过该数据库,可以对各生态中心、站点的信息进行各种形式的查询和统计汇总,随时掌握各生态中心、站点的信息的详情,还可以为日常与生态有关科学研究提供图形和属性数据。
3.2系统软件结构
(1)操作系统采用微软的Windows NT Server4.0 +Windows NT/2000/XP系统;
(2)数据库采用Oracle10,用来存储所有与地籍相关的空间数据和非空间数据;
(3)系统采用B/S三层结构,服务器端采用Microsoft IIS4.0,客户端采用IE6.0;
(4)GIS系统采用hatergraph公司的Geomedia系统软件,Geomeclia Professional作为桌面 GIS系统,用以进行数据的编辑处理和管理,Geomeclia WebMap作为 GIS数据服务器,用来进行地籍数据的发布,以便在IE上进行浏览和查询、输出[2]。
3.3数据的存储方式
(1)各站点的生态数据库,存放本地的自己管理权限以内图形、图像数据和属性数据;
(2)分中心数据库存放需要由分中心办理的图形、图像数据和属性数据及一些统计和汇总数据;
(3)对于跨两个分中心的宗地,原则上在两个分中心的数据库中均要有记录。
3.4数据的管理方式
在早期的生态管理信息系统中,数据的存储方式主要是空间数据的文件方式管理和属性数据的关系数据库管理方式,在单机上取得了一定的成功,但随着生态管理信息化的发展和GIS在生态管理中的应用,空间数据的文件管理模式在实现数据共享、网络通信、进发控制及数据的安全恢复机制等方面出现了难以解决的问题。因此,在生态数据库的设计中,采取了空间数据和属性数据的全关系数据库管理方式,用关系数据库管理空间数据和属性数据。在数据库产品中,选取了Oracle10版本,因为它提供的空间数据管理工具Spatial Cartridge(SC)是一个真正的Client/Server机制的产品,提供了分布式处理能力、全部的Oracle安全管理机制、SQL方式访问空间数据等功能。基于这种模式下,可以实现数据的共享和分布式处理。
3.5数据的访问和更新模式
各生态站点将自己管理权限内图形、图像数据和属性数据存放在Oracle10数据库中,分中心数据库存放的是需要分中心办理的图形、图像数据和属性数据,一些统计和汇总数据。属性数据的访问和更新可以利用Oracle数据库提供的数据库链路、视图、快照等直接对属性数据进行透明访问和进行操作。而空间数据的访问和更新则利用SC提供的多记录多字段存储空间数据、支持数据复制、分布式空间数据和高速大批量数据调用、支持分批数据调用的功能来实现,这样,在个站点变更自己数据的同时,分中心数据库也能同步更新,总中心也能从分中心、个站点调用最新的数据。
4、系统体系结构设计
基于以上分析,可以根据实际条件及需要,设立多个站点进行数据采集及管理工作。理想情况下,每个站点采用C/S与B/S相结合的体系结构,如图1所示,C/S体系结构可以分为两层,也可以根据需要设计为三层或多层;B/S体系结构一般分为三层,即数据服务层、应用服务层及应用层。考虑到与已有数据库系统的集成、并保护现有的软件平台的投资,本系统采用微软的DCOM技术及Oracle10数据库。
4.1数据服务层
数据服务层为应用服务层提供所需的数据服务,包括空间数据、属性数据、管理数据、元数据等的存储及数据库连接组件。
4.2应用服务层
应用服务层是分布式GIS的核心,可以分为分布式服务和GIS应用服务两部分。分布式服务包括目录服务、注册服务、事件服务以及安全服务等,这些服务是建立分布式GIS的基础,可以通过DCOM的分布式服务进行扩展实现。GIS应用服务层是分布式GIS的应用核心。主要实现GIS的应用服务,如数据格式转换服务、GIS空间分析服务、数据获取服务等。可以根据数据量及访问的负载情况的不同,将GIS应用服务器设置在一台或多台机器上。
4.3应用层
应用层包括两种客户端,即C/S客户端及B/S客户端。C/S客户端需要安装GIS应用软件,实现对地图数据及属性数据的维护,进行空间分析、查询统计、决策支持等比较复杂的操作。B/S客户端需要安装浏览器及完成地图基本操作功能的ActiveX控件。
在这种体系结构下,生态系统网络平台上的不同站点之间很容易通过分布式数据库进行数据共享,或者通过Web服务器提供的数据下载功能得到其他站点的数据。
5、系统功能设计
生态系统管理的内容包括个站的位置及其所拥有的测量仪器,长期监测的植被类型的位置及相关的属性。及其相关的RS数据对植被类型可视化监测。系统的功能结构见图2。
(1)系统功能:包括单位信息管理、权限管理、日志管理、模版管理、原数据管理等;
(2)地图管理:提供对物理图层的管理,包括地图基本操作(如放大、缩小、漫游、定位、距离测量)、双向查询、图层管理、地图编辑、地图出版等;
(3)空间分析:包括切面分析和区域分析(如圆形、四边形、不规则区域、缓冲区)等;
(4)拓扑分析:包括连通性分析及最短路径分析等;
(5)网络资源:提供线路一级的管理,一条线路由线段及站等连接而成;
(6)统计报表:自动生成各种通信报表;
(7)数据接口:与上、下级单位及同级单位的数据交换接口,包括地图数据、属性数据及报表数据;
(8)业务管理:包括采集数据、对外经营业务等;
(9)web服务:基于web的地理信息查询及数据下载等服务。
6、分布式数据库设计
早期的GIS空间数据和属性数据是分离存储的,空间数据以文件的形式存储,属性数据则存储在关系数据库中。这种方式也称为混合结构模式,其弱点是空间数据与属性数据的一致性难以保持,GIS的开放性和互操作性受到限制,数据共享和并行处理没有保证。另一种方式是统一存储模式,即使用关系数据库管理系统(RDBMS)或面向对象的数据库管理系统(00DBMS)统一存储和管理空间数据及属性数据。对于大型分布式地理信息系统,应采用统一存储模式。
6.1空间数据的分幅与分层
分幅:由于各站点只能采集及维护自己管辖范围内的数据,最直接的方法就是按照站点辖区域对地理数据进行分幅,按照所管辖的地域及植被类型分别存储及维护自己的数据。在数据分别存储的同时,也可以根据需要进行一定程度的集中,如总站、分中心也可以同时存储下级站点及相邻站点的数据,但不鼓励过多地重复存储。
分层:地理信息系统是按照分层的思想组织地图数据的,一般情况下同一种植被类型组织在同一图层中。从管理及数据的安全性方面考虑,应使不同级别的同一种设备处于不同的图层。
6.2数据库组织
每一个站点上的数据库应包括:管辖区域的空间数据及属性数据、其他管理信息数据及元数据,并按层次组织在数据库中(图3),每一层的内容如下:
物理层包括空间数据及属性数据,为了支持规划设计,每个图层都具有一个状态属性,它可以是“运行态”、“在建态”或“规划态”,并支持从“规划态”到“在建态”再到“运行态”的转换。背景图层不需要经常更新和传输,以外部文件的方式存储,设备图层则应存储在数据库中。
逻辑层由多个物理层及物理层上不同对象之间的关系组成,如光纤网络由若干条光纤线路组成,而每一条光纤线路由若干条光纤段及光纤站连接而成管理信息层通常是MIS系统中需要管理的信息。
元数据层是对底层数据集的描述信息,对数据的内容、质量、数据量、采集方法和所有者等进行说明[5]。
7、C/S与B/S相结合的体系结构
在最高级别的管理单位实现C/S与B/S相结合的体系结构。C/S体系结构只能供处于局域网上的少数用户使用,只有实现了B/S体系结构,此系统才能为整个行业提供地理信息服务,如下级单位可以浏览通信网的概貌,可以对地图进行基本的操作,也可以进行数据下载及上传。
8、发展方向
基于行业的大型地理信息系统具有数据分布采集、维护以及集中使用的特点。同一行业的不同部门之间需要进行数据共享及相互协作,不同行业之间往往也需要相互协作,因为不同行业的设备可能处于相同的地理空间。由于不同的系统所用的平台可能不同,数据格式多种多样,数据集中使用的技术难度很大,另外还有管理及其他方面的障碍。
分布式地理信息系统一直处在不断发展之中,其发展方向之一是朝着分布式服务体系结构或地理信息服务的方向发展,也称联合GIS,即建立分布式数据管理服务器对多个GIS站点进行统一管理,如图3所示。此体系结构支持企业间不同应用之间的互操作,可以采用基于XML和SOAP的Web Services框架来实现[6]。
在分布式服务体系结构的基础上,建立一套适应于地理信息服务的全新的框架体系,能够较好地解决目前所面临的不同系统之间的信息共享及互操作等问题。
随着计算机硬件、软件和宽带网技术的不断发展,笔者认为分布式技术必将更充分应用到生态信息系统的建设之中,传统的集中式的数据库管理模式将被分布式数据管理模式所代替。在大范围使用上,目前存在的主要问题是数据传输速度不够理想,一些功能还需要进一步完善。
参考文献:
[1]王能斌.数据库系统[M].北京:电子工业出版社,1995.
[2]史济民.数据库原理与应用[M]成都:成都电子科技大学出版社,1985.
[3]闫国年,张书亮,龚敏霞等.地理信息系统集成原理与方法[M].北京:科学出版社,2003.
[4]倪建立,孟令奎,王宇川等.电力地理信息系统[M].北京:中国电力出版社,2004.
[5]曹彦荣,何建帮.地理信息语义关系元数据研究及应用[J].计算机科学,2004,31(1):72—76.
[6]李建强,范玉顺.企业集成平台技术研究[J].计算机科学,2004,31(1):66-68.