分布式生态系统数据库与地理信息系统研究

来源 :理论纵横 | 被引量 : 0次 | 上传用户:chenzhong1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:分布式应用有着可扩展性、可配置性、灵活可靠性及跨平台等优点。随着Oracle空间数据处理功能以及GIS软件的不断完善,采用分布式数据库技术解决地理信息系统中大量的空间图形数据的问题是行之有效的。本文以mapinfo为例,详细地说明了基于Oracle的地理信息系统数据库的分布式设计与实现方案,包括系统体系结构设计、系统功能设计、分布数据存储与管理,最后给出了展望。
  关键词:分布式数据库;地理信息系统;Oracle;分布式地理信息系统
  
  1、概况
  地理信息系统(Geographic Information System,GIS)是对地理空间数据进行输入、存储、检索、分析、建模、显示、输出等处理的计算机系统。自从20世纪60年代世界上第一个GIS诞生以来,GIS得到了迅速发展,广泛地应用在地质、农业、城市建设、商业、军事等领域,取得了良好的经济效益和社会效益。
  分布式数据库系统(Distributed Data Base,System DDBS)是由若干个站集合而成的,这些站又称为节点,它们在通讯网络中连接在一起,每个节点都是一个独立的数据库系统,它们又拥有各自的数据库中央处理器、终端,以及各自的局部数据库管理系统,因而分布式数据库系统可以看成一系列集中式数据库系统联合,它们在逻辑上属于同一系统,但在物理结构上是分布的。它具有以下优点:
  (1)有利于改善性能。大部分数据库可以就地访问,减少通信开销,避免集中式数据库的瓶颈问题;
  (2)扩充性好。可以根据发展的需要增减节点。或对系统重新配置,比集中式数据库灵活;
  (3)可用性好。系统部分失效后,完好的部分仍可以继续运用。如果采用冗余技术,还可以获得一定的容错能力;
  (4)自治性好。可以分散管理,统一协调,各个部门的用户总是希望拥有自己的数据,管理自己的数据,同时又想共享其它部门的有关数据,分布式数据库比较好的满足了用户的这些要求。
  分布式数据库技术被应用到GIS这样的特定的领域中,出现了空间数据库(分布式GIS数据库系统),空间数据能够用于表示物体的位置、形状、大小和分布特征等诸方面信息,适用于描述所有二维、三维和多维分布的关于区域的现象,是地理系统的基础和核心。用关系数据库与空间数据库协同管理地理信息数据,是近年来地理信息系统分布式处理的常用方法之一,其分布式实现主要依赖于关系数据库(如Oracle)所提供的分布式功能。
  分布式地理信息系统(Distributed GIS,DGIS)是指以分布式计算理论和计算机网络技术为基础,在计算机网络环境下实现地理数据采集、存储、管理、分析、表现等功能的地理信息系统。现有分布式地理信息系统的应用从低级到高级分为七种类型:原始数据下载、静态图像浏览、元数据目录浏览、动态图像浏览、基于Web的GIS查询和分析及智能网络型地理信息系统。
  目前,分布式地理信息系统的实现主要基于三种分布式计算技术:对象管理组织(0MG)的CORBA技术、微软公司的DCOM技术和SUN公司的EJB技术。它们是当前分布式软件技术的代表,三者均有自己的特点和优势,为分布式GIS的设计、开发和广泛应用提供了基本的技术保证。
  2、中国生态信息系统研究网络GIS系统数据特征
  中国生态系统研究网络(CERN)是由分布于全国的36个生态系统定位研究站、5个学科分中心和1个综合研究中心组成的生态系统研究网络,组建于1988年。其目的是在大尺度上进行长期的生态和环境监测研究。
  2.1海量性
  中国生态系统长期动态监测数据库包括中国典型生态系统,即农田生态系统、森林生态系统、草地生态系统、湖泊生态系统和海湾生态系统共29个定位生态站上进行的水环境、土壤环境、大气环境、生物环境等方面的长期定位监测数据。
  中国生态系统数据具有显著的空间特征,丰富的自然属性,以及较强的时态性。例如就森林而言,除了森林的空间位置,还涉及到森林生态系统土壤水分常数表、中子仪测量的各生态站森林土壤体积含水量和土层储水量、9个森林生态站的土壤含水量、雨水、地下水水质、地下水位、穿透降水量、树干径流量、穿透降水成分分析、树干径流成分分析、9个森林生态站的森林蒸散、森林内地表水径流量、森林枯枝落叶含水量、关于植物群落乔木层各种乔木的胸径、高度、生活型等的调查数据、森林植物群落乔木层、灌木层生物量模型、关于站区各种动物数量的调查数据、森林植物群落灌木层植物种组成、森林植物群落草本层调查(2003年以前)、记录站区生物群落中主要微生物的种类和名称、森林植物群落乔木层群落特征、记录站区发生的病虫害和自然灾害的发生日期及危害情况、森林植物群落灌木层群落特征、植物群落凋落物回收量季节动态(2003年前)、记录综合观测场内灌木层的干重和模型、植物群落凋落物回收量季节动态(2004年后)、关于植物群落灌木层、草本层各种植物的盖度、多度、生活型等的调查数据、植物群落乔木层植物种组成(2004年后)、记录站区生物群落中主要野生动物的种类和名称、森林植物群落草本层植物种组成(2004年后)、森林生态系统地下水位记录表、2003年前中子仪土壤含水量平均值、2004年后森林烘干法土壤含水量表、2004年后森林地表径流量表、枯枝落叶含水量表、中子仪土壤含水量统计表、森林植物群落乔木层每木调查与生物量、关于站区植被、植物群落、地貌、水分、土壤、人类活动情况、动物活动情况、演替特征等的调查数据、森林水面日蒸发量数据表、森林土壤硝态氮和铵态氮动态、1999-2006年森林土壤容重、机械组成、微量元素和重金属元素、矿质全量、养分等。且生态数据种类繁多,数据的存储类型多样等,这些就构成中国生态信息系统得基础。对一个生态信息系统,应当具有管理、分析以及应用如此大量数据的能力。但目前对“海量”一词尚无统一的界定,一种观点认为,系统使用和管理的数据大于10000G时,在常规计划机上运行的数据库系统的运行效能明显下降。
  2.2数据源具有分布性
  中国生态系统分中心有五个分中心:水分分中心、土壤分中心、大气分中心、生物分中心、水域生态系统分中心组成。其下有14个农业生态系统研究站、9个森林生态系统研究站、2草原生态系统研究站、5个沼泽生态系统研究站、1个荒漠生态系统研究站、2个湖泊生态系统研究站、3个海湾生态系统研究站。这些分中心和站点分布在全国各地,且每一个站点都有自己的数据库,记录着大量的基础数据,各分中心有管理者自己辖区的数据采集、存储、管理等,当总站和分中心需要个站点的数据时,就可以通过远程网络来访问,因此没有必要建立一个集中数据库。
  2.3数据访问
  中国生态系统网络主要是以地面网络式观测、试验为主,结合RS、GIS系统和数学模型等手段,实现对中国各主要生态系统和环境状况的长期、全面的监测和研究。这些都需要分布式GIS数据库。表现在:
  (1)科学研究中,不论是分中心还是个站点需要查询相关的图形和属性信息,都需要连接数据库;
  (2)中心站点汇集各个站点收集到的数据需要访问数据库及数据库之间的操作;如果采用集中式数据库,如此频繁的数据访问和数据提取都通过远程网络来实现,影响个站点的日常办公效率,影响图形数据和属性数据的一致性,一旦网络出现故障,系统将崩溃,而使用分布式数据库,个站点和分中心只需要访问本地数据库。能保证数据的一致性和安全,提高办事效率。
  3、分布式地理信息系统解决方案
  分布式数据库的实现,主要基于数据的存储方式、数据的访问和更新模式,笔者在文中以中国生态系统网络中心的数据库的解决方案为例,对分布式数据库的实现方式进行了说明。3.1生态数据库的建库目标
  建立中国统一的无缝生态数据库,该生态数据库包含了全国所有分中心、个站点的空间数据,包括个站点的位置,个站点取样植被的位置及其拓扑关系,还包括各分中心、站点的属性信息。并且这些数据植被类型、时间、气候等的变更而同步更新。通过该数据库,可以对各生态中心、站点的信息进行各种形式的查询和统计汇总,随时掌握各生态中心、站点的信息的详情,还可以为日常与生态有关科学研究提供图形和属性数据。
  3.2系统软件结构
  (1)操作系统采用微软的Windows NT Server4.0 +Windows NT/2000/XP系统;
  (2)数据库采用Oracle10,用来存储所有与地籍相关的空间数据和非空间数据;
  (3)系统采用B/S三层结构,服务器端采用Microsoft IIS4.0,客户端采用IE6.0;
  (4)GIS系统采用hatergraph公司的Geomedia系统软件,Geomeclia Professional作为桌面 GIS系统,用以进行数据的编辑处理和管理,Geomeclia WebMap作为 GIS数据服务器,用来进行地籍数据的发布,以便在IE上进行浏览和查询、输出[2]
  3.3数据的存储方式
  (1)各站点的生态数据库,存放本地的自己管理权限以内图形、图像数据和属性数据;
  (2)分中心数据库存放需要由分中心办理的图形、图像数据和属性数据及一些统计和汇总数据;
  (3)对于跨两个分中心的宗地,原则上在两个分中心的数据库中均要有记录。
  3.4数据的管理方式
  在早期的生态管理信息系统中,数据的存储方式主要是空间数据的文件方式管理和属性数据的关系数据库管理方式,在单机上取得了一定的成功,但随着生态管理信息化的发展和GIS在生态管理中的应用,空间数据的文件管理模式在实现数据共享、网络通信、进发控制及数据的安全恢复机制等方面出现了难以解决的问题。因此,在生态数据库的设计中,采取了空间数据和属性数据的全关系数据库管理方式,用关系数据库管理空间数据和属性数据。在数据库产品中,选取了Oracle10版本,因为它提供的空间数据管理工具Spatial Cartridge(SC)是一个真正的Client/Server机制的产品,提供了分布式处理能力、全部的Oracle安全管理机制、SQL方式访问空间数据等功能。基于这种模式下,可以实现数据的共享和分布式处理。
  3.5数据的访问和更新模式
  各生态站点将自己管理权限内图形、图像数据和属性数据存放在Oracle10数据库中,分中心数据库存放的是需要分中心办理的图形、图像数据和属性数据,一些统计和汇总数据。属性数据的访问和更新可以利用Oracle数据库提供的数据库链路、视图、快照等直接对属性数据进行透明访问和进行操作。而空间数据的访问和更新则利用SC提供的多记录多字段存储空间数据、支持数据复制、分布式空间数据和高速大批量数据调用、支持分批数据调用的功能来实现,这样,在个站点变更自己数据的同时,分中心数据库也能同步更新,总中心也能从分中心、个站点调用最新的数据。
  4、系统体系结构设计
  基于以上分析,可以根据实际条件及需要,设立多个站点进行数据采集及管理工作。理想情况下,每个站点采用C/S与B/S相结合的体系结构,如图1所示,C/S体系结构可以分为两层,也可以根据需要设计为三层或多层;B/S体系结构一般分为三层,即数据服务层、应用服务层及应用层。考虑到与已有数据库系统的集成、并保护现有的软件平台的投资,本系统采用微软的DCOM技术及Oracle10数据库。
  
  4.1数据服务层
  数据服务层为应用服务层提供所需的数据服务,包括空间数据、属性数据、管理数据、元数据等的存储及数据库连接组件。
  4.2应用服务层
  应用服务层是分布式GIS的核心,可以分为分布式服务和GIS应用服务两部分。分布式服务包括目录服务、注册服务、事件服务以及安全服务等,这些服务是建立分布式GIS的基础,可以通过DCOM的分布式服务进行扩展实现。GIS应用服务层是分布式GIS的应用核心。主要实现GIS的应用服务,如数据格式转换服务、GIS空间分析服务、数据获取服务等。可以根据数据量及访问的负载情况的不同,将GIS应用服务器设置在一台或多台机器上。
  4.3应用层
  应用层包括两种客户端,即C/S客户端及B/S客户端。C/S客户端需要安装GIS应用软件,实现对地图数据及属性数据的维护,进行空间分析、查询统计、决策支持等比较复杂的操作。B/S客户端需要安装浏览器及完成地图基本操作功能的ActiveX控件。
  在这种体系结构下,生态系统网络平台上的不同站点之间很容易通过分布式数据库进行数据共享,或者通过Web服务器提供的数据下载功能得到其他站点的数据。
  5、系统功能设计
  生态系统管理的内容包括个站的位置及其所拥有的测量仪器,长期监测的植被类型的位置及相关的属性。及其相关的RS数据对植被类型可视化监测。系统的功能结构见图2。
  
  (1)系统功能:包括单位信息管理、权限管理、日志管理、模版管理、原数据管理等;
  (2)地图管理:提供对物理图层的管理,包括地图基本操作(如放大、缩小、漫游、定位、距离测量)、双向查询、图层管理、地图编辑、地图出版等;
  (3)空间分析:包括切面分析和区域分析(如圆形、四边形、不规则区域、缓冲区)等;
  (4)拓扑分析:包括连通性分析及最短路径分析等;
  (5)网络资源:提供线路一级的管理,一条线路由线段及站等连接而成;
  (6)统计报表:自动生成各种通信报表;
  (7)数据接口:与上、下级单位及同级单位的数据交换接口,包括地图数据、属性数据及报表数据;
  (8)业务管理:包括采集数据、对外经营业务等;
  (9)web服务:基于web的地理信息查询及数据下载等服务。
  6、分布式数据库设计
  早期的GIS空间数据和属性数据是分离存储的,空间数据以文件的形式存储,属性数据则存储在关系数据库中。这种方式也称为混合结构模式,其弱点是空间数据与属性数据的一致性难以保持,GIS的开放性和互操作性受到限制,数据共享和并行处理没有保证。另一种方式是统一存储模式,即使用关系数据库管理系统(RDBMS)或面向对象的数据库管理系统(00DBMS)统一存储和管理空间数据及属性数据。对于大型分布式地理信息系统,应采用统一存储模式。
  6.1空间数据的分幅与分层
  分幅:由于各站点只能采集及维护自己管辖范围内的数据,最直接的方法就是按照站点辖区域对地理数据进行分幅,按照所管辖的地域及植被类型分别存储及维护自己的数据。在数据分别存储的同时,也可以根据需要进行一定程度的集中,如总站、分中心也可以同时存储下级站点及相邻站点的数据,但不鼓励过多地重复存储。
  分层:地理信息系统是按照分层的思想组织地图数据的,一般情况下同一种植被类型组织在同一图层中。从管理及数据的安全性方面考虑,应使不同级别的同一种设备处于不同的图层。
  6.2数据库组织
  每一个站点上的数据库应包括:管辖区域的空间数据及属性数据、其他管理信息数据及元数据,并按层次组织在数据库中(图3),每一层的内容如下:
  物理层包括空间数据及属性数据,为了支持规划设计,每个图层都具有一个状态属性,它可以是“运行态”、“在建态”或“规划态”,并支持从“规划态”到“在建态”再到“运行态”的转换。背景图层不需要经常更新和传输,以外部文件的方式存储,设备图层则应存储在数据库中。
  逻辑层由多个物理层及物理层上不同对象之间的关系组成,如光纤网络由若干条光纤线路组成,而每一条光纤线路由若干条光纤段及光纤站连接而成管理信息层通常是MIS系统中需要管理的信息。
  元数据层是对底层数据集的描述信息,对数据的内容、质量、数据量、采集方法和所有者等进行说明[5]
  7、C/S与B/S相结合的体系结构
  在最高级别的管理单位实现C/S与B/S相结合的体系结构。C/S体系结构只能供处于局域网上的少数用户使用,只有实现了B/S体系结构,此系统才能为整个行业提供地理信息服务,如下级单位可以浏览通信网的概貌,可以对地图进行基本的操作,也可以进行数据下载及上传。
  8、发展方向
  基于行业的大型地理信息系统具有数据分布采集、维护以及集中使用的特点。同一行业的不同部门之间需要进行数据共享及相互协作,不同行业之间往往也需要相互协作,因为不同行业的设备可能处于相同的地理空间。由于不同的系统所用的平台可能不同,数据格式多种多样,数据集中使用的技术难度很大,另外还有管理及其他方面的障碍。
  分布式地理信息系统一直处在不断发展之中,其发展方向之一是朝着分布式服务体系结构或地理信息服务的方向发展,也称联合GIS,即建立分布式数据管理服务器对多个GIS站点进行统一管理,如图3所示。此体系结构支持企业间不同应用之间的互操作,可以采用基于XML和SOAP的Web Services框架来实现[6]
  
  在分布式服务体系结构的基础上,建立一套适应于地理信息服务的全新的框架体系,能够较好地解决目前所面临的不同系统之间的信息共享及互操作等问题。
  随着计算机硬件、软件和宽带网技术的不断发展,笔者认为分布式技术必将更充分应用到生态信息系统的建设之中,传统的集中式的数据库管理模式将被分布式数据管理模式所代替。在大范围使用上,目前存在的主要问题是数据传输速度不够理想,一些功能还需要进一步完善。
  参考文献:
  [1]王能斌.数据库系统[M].北京:电子工业出版社,1995.
  [2]史济民.数据库原理与应用[M]成都:成都电子科技大学出版社,1985.
  [3]闫国年,张书亮,龚敏霞等.地理信息系统集成原理与方法[M].北京:科学出版社,2003.
  [4]倪建立,孟令奎,王宇川等.电力地理信息系统[M].北京:中国电力出版社,2004.
  [5]曹彦荣,何建帮.地理信息语义关系元数据研究及应用[J].计算机科学,2004,31(1):72—76.
  [6]李建强,范玉顺.企业集成平台技术研究[J].计算机科学,2004,31(1):66-68.
其他文献
摘要:运用教学实验方法,对高中学生进行篮球流动苇箔写学习效果的研究。结果表明,通过篮球游戏教学,提高了篮球的基本技术,培养了学生的组织能力、讲解能力、创造和应变能力等综合素质;篮球游戏教学具有娱乐性、竞争性和锻炼性等特点,可以降低学生的焦虑水平,增强学生自信心,促进个体社会化和培养学生的社会适应能力,以适宜的负荷促进了躯体的健康发展,并且培养学生团结协作的精神,从而有助于促进学生身心健康全面发展。
期刊
摘要:一名教育教学技艺高超的班主任,首先必须了解自己、剖析自己的个性特点、找到自己的长处和弱点、扬长避短寻找适合自己的教育方式、然后再经过长期学习、探索、心领神会形成独特的教育风格。  关键词:管理风格;创新实践;班级管理    班主任工作是琐碎繁杂的,每日都要面对那一群年龄差不多,思想各异,性格不同的学生,处理各种各样的问题,他们多种多样、层出不穷的“花样”,使你疲于奔命。或者是你的千篇一律,道
期刊
摘要:分析了水体富营养的形成原因、危害以及我国湖泊水体的水体富营养化现状。从三方面详细阐述具体的生态修复措施,介绍其应用效果及优缺点。  关键词:富营养化;成因;危害;治理对策    湖泊是人类赖以生存的重要水资源,它不仅是农业、养殖业、以及生活用水的主要水源,同时还具有维持生物多样性、调节气候、蓄纳洪水、调节地表径流、净化水质等功能。但是随着经济的发展,城镇人口不断增加,工业废水、生活污水的排放
期刊
摘要:文章阐述了我国汽车产业的现状,分析了我国汽车产业存在的问题,并从国家政策层面和具体措施方面就加快我国汽车产业的发展提出了一些建设性的政策建议。  关键词:汽车产业;发展现状;政策建议    自从1886年德国工程师卡尔本茨发明制造了世界上第一辆汽车以来,一百多年来汽车给世界带来了翻天覆地的变化。同样,汽车这个“改变世界的机器”也给中国带来了巨大的变化,特别是2000年中国政府第一次提出“鼓励
期刊
摘要:自改革开放以来,在我国农业生产组织方式上基本采用了家庭联产承包责任制这一形式。但随着社会经济形势的发展,以家庭为单位的农业生产组织形式也逐步暴露出许多弊端,现阶段必须探索我国农业生产组织经营模式的新途径,我国农业生产经营模式的最佳选择是构建民营农场制度。而构建民营农场制度会使大部分农民从土地经营中分离出来,必然会有人担心和涉及如何解决农村剩余劳动力这个重要问题,本文对这一问题进行详细分析、论
期刊
摘要:大学生的恋爱现象已不容回避,高校德育工作者对此应采取积极介入态度,结合当代大学生婚恋观的实际特点,强化对大学生的传统家庭伦理道德教育。  关键词:婚恋观;传统道德;家庭教育    随着新《婚姻法》的出台讨论,社会上也曾掀起过能否允许在校大学生结婚的讨论。某高校校长对此发表了“只要合乎法律,即允许结婚”的看法,一时备受注目。这是一个进步,说明高校德育工作者已逐步正视了大学生的恋爱行为和现象;但
期刊
摘要:“教”与“学”、“教师”与“学生”是教学改革中讨论的永恒主题。对任何一方面的关注都应有一个“度”的问题,超过了一定的“度”,就可能走向某种极端。研究性学习是学生在教师的指导下所进行的学习活动,它强调学生的自主性和主体地位,但并不意味着取消或弱化教师的指导作用。研究性学习中教师的指导作用主要体现在以下几个方面:指导学生激发起研究的兴趣;指导学生确定和选择合适的研究课题;指导学生逐步推进研究过程
期刊
摘要:介绍了以问题教学法为基础,针对目前有机化学教学中存在的问题,构建有机化学问题式教学模式的实践过程和教学效果。  关键词:有机化学;问题式教学模式;实践    一、问题教学法与问题式教学模式    古人云“学起于思,思源于疑”,而“学贵在知疑,小疑则小进,大疑则大进,疑者觉悟之机也”。它深刻地揭示了疑、思、学三者之间的关系。问题教学法是20世纪初由美国教育家杜威在反对传统教育中提出的。他所倡导
期刊
摘要:多媒体技术的出现为我们教学手段改进提供了新的机会。随着计算机的普及,多媒体技术被广泛应用到教育教学上,极大地激发了学生学习兴趣,丰富了教学资源,增加了课堂容量,提高了学习效率。本文辩证分析了多媒体技术在英语课堂教学中的利与弊,并针对性的提出了解决措施,以求真正优化课堂教学。  关键词:中学英语;课堂教学;多媒体;利与弊    “教师如何教,学生如何学”一直以来都是人们争论不休的话题。那么,在
期刊
摘要:赏识教育体现着师爱的真谛,符合人本主义教育,强调以人为本的理念,即教育教学工作应以学生为本。因为学生是活生生的、有血有肉、有感情的生命体,他们有自己的思想、愿望、意志、需要,有权得到公正、平等的待遇,获得他人对自己的尊重,满足自尊的需要,并以此实现由他尊到自尊的转化,由他律向自律的转化,由外驱动力到内驱动力的转化,形成从外因的作用到内因发展的必然。  关键词:赏识教育;期望;信心;肯定;自尊
期刊