基于XML与中间件技术的GIS空间数据存取

来源 :计算机辅助工程 | 被引量 : 0次 | 上传用户:daihongjun2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:为将地理信息系统(Geographic Information System,GIS)的空间数据存储于关系数据库管理系统(Relational DataBase Management System,RDBMS)中,利用RDBMS中的XML扩展功能,研究在DB2 9中以XML方式存储GIS空间数据的方法,实现shape文件空间数据在DB2 9中的存储,设计并实现数据访问中间件. 研究表明该方法对某些GIS应用具有实用价值.
  关键词:地理信息系统; XML; 中间件; DB2数据库
  中图分类号:TP311.132.3; P208
  文献标志码: A
  
  GIS spatial data access based on XML and middleware technology
  WANG Anbao,WU Cuihong
  (School of Computer & Info.,Shanghai Second Polytechnic Univ.,Shanghai 201209,China)
  Abstract:To store the GIS spatial data into RDBMS(Relational DataBase Management System),using the extension function of XML in RDBMS,the method of storing GIS spatial data as XML in DB2 9 is studied. It is implemented that the GIS spatial data in shape file is stored into DB2 9. And a data access middleware is designed and implemented.The study indicates that the method is significant for some GIS applications.
  Key words:geographic information system; XML; middleware; DB2 Database
  
  0 引 言
  
  地图数据是地理信息系统(Geographic Information System,GIS)的基础,一般数据文件包括空间位置数据、空间关系数据和非空间属性数据.传统的地图文件将空间数据和属性数据分开存放:空间数据以文件形式存储,属性数据存储于关系数据库中,二者之间用关键字或指针进行关联.[1]最新的GIS技术是将所有空间数据和属性数据都保存在大型空间数据库中,如DB2 Spatial Extender和Oracle Spatial等.近年来GIS与关系数据库管理系统(Relational DataBase Management System,RDBMS)相结合的应用也比较广泛[2,3],但空间数据库系统一般较大,对计算机要求比较高,需要专门的中间件应用软件(如ArcSDE)进行访问.对于单机和中小型的GIS应用还是使用空间数据和属性数据分开存储的方式.这种管理方式的结果使实用性受到很大限制:数据完整性和一致性不能保证;GIS的开放性及互操作性受到限制;数据共享和并行处理无法保证;查询速度慢等.随着XML应用的不断扩展,基于XML的GIS应用研究渐渐引起更多研究人员的关注.[4,5]本文尝试将空间数据与属性数据均存放在关系数据库中,通过对shape文件结构进行解析,将其转换成XML文件,在关系数据库中建立相应的数据表,然后将含有空间数据和属性数据的XML文件存入关系数据库中进行地图数据的统一管理,从而有效解决数据的完整性、一致性以及地图数据的共享等,并实现从数据库中读取地图数据.
  
  1 空间数据的关系数据库存取机制
  
  2.1 空间数据的关系数据库存储
  由于属性数据本身就以数据库的形式存放,因此将其存储到关系数据库中相对比较简单.本文使用DB2,只须建立相应的表结构并将属性数据从dbf文件中读出,然后写入DB2中相应的数据表即可.而空间数据部分一方面种类比较多,另一方面同一种类型的数据(如多边形等,点的数量是不定的)长度是变化的,难以建立相应的表结构.一般有以下2种方法:(1)建立多字段的数据表,将空间数据的每个点坐标逐个存入数据库中;(2)采用数据关联技术,在主表中保存数据类型,副表中存储相应结构的数据序列,二者通过关键字关联.
  第1种方法需要建立足够多的字段结构,而点的数量不够会造成空间浪费,另一方面,由于关系数据库的自身限制,每个表的最大字段数量也受到相应限制,因而不能存储包含点数较多的对象.第2种方法需要进行数据库的关联操作,而且对于每个超过1个点的对象都需要建立1个副表,这样对副表的数量需求很多,不利于数据管理.本文采用DB2 9的XML存储机制实现GIS空间数据在关系数据库中的存储,完全不同于上述2种方法,能很好地克服其缺点.
  DB2 9的pureXML功能可针对符合语法规范的XML进行存储、更新、删除、查询,并建立索引.用户可通过在查询中整合XPath,XQuery和SQL来检索全部XML文档或文档片断.用户还可以注册XML模式[6],并命令DB2根据这些模式验证XML文档.它以树形存储方式对待XML数据,保证XML数据与生俱来的层次结构和灵活性,可满足企业用户对呈几何量级增长的XML数据的存储需要.
  以shape文件中的PloyLine几何类型为例说明如何将GIS空间数据以DB2 XML方式存储,其原理见图1,主要有3项关键技术:(1)如何将shape文件中的空间几何数据转换成XML格式,本文采用JAXB 2技术实现;(2)如何将转换好的含有空间几何数据的XML文件存储到DB2 9中;(3)如何对DB2 9中XML数据进行操作,这不是本文研究的重点.
  


  图 1 GIS空间数据以DB2 9 XML方式存储的处理过程
  
  由于XML具有自定义性及可扩展性,因此足以表达各种类型的数据,通过编程与实验,可以完整无误地将shp空间几何数据文件的所有层次数据按照XML的标签层次结构进行存储,然后将其存入DB2 中,客户可以使用JDBC从数据库中取得全部或部分XML数据,然后应用于显示或进行处理,也可以在不同GIS数据格式之间进行转换.
  从图1 可以看出,GIS应用程序可以直接使用文件系统的数据,如:shp,dbf和shx文件,也可以使用转换后的XML空间数据文件,或者从DB2 9中读取部分或全部的XML空间数据,这给具体应用带来极大的便利性,即在不同的场合选择不同的存储格式.将空间几何数据存入DB2 9后,所有与DB2 9相连的客户端都可以按自己的要求存储、更新、删除和查询以XML格式进行存储的空间数据,这在一定程度上保证空间数据的一致性和安全性.1.2 GIS空间数据XML方式存储实现
  以shape文件中的PloyLine几何类型为例,PloyLine的空间实体数据结构可以下列代码描述,其中每个字段的含义参见文献[7].
  PolyLine
  {
  Double[4] Box
  Integer NumParts
  Integer NumPoints
  Integer[NumParts] Parts
  Point[NumPoints] Points
  }
  使用Java语言进行建模,建立相应的Java对象,主要有PolyLine,Box,Parts,Points,Point.然后利用JAXB将这些空间数据对象按其层次关系映射为XML中的标签层次结构,以实现从shp到XML的转换.图2为上海市长宁区的中心线道路shape文件转换为XML的文件片段.
  


  图 2 上海市长宁区中心线道路XML文件片段
  
  2 空间数据关系数据库访问的中间件设计
  
  2.1 中间件技术
  中间件是1种独立的系统软件或服务程序,分布式应用软件借助它在不同技术之间共享资源.中间件位于客户机服务器的操作系统之上,管理计算资源和网络通信.中间件不仅实现互连,还要实现应用之间的互操作.中间件是基于分布式处理的软件,最突出的特点是其网络通信功能较强.在中间件应用的体系结构中,中间件屏蔽信息访问的底层细节,并向客户应用提供1组接口,客户应用通过接口与中间件进行通信,与数据服务器无关,保持客户应用的相对独立性.当信息结构发生变化时,只要中间件作相应更新,客户端应用程序甚至可以不作任何修改就能继续应用于新的系统.2.2 基本思想
  随着GIS应用向分布式管理系统领域的转移,空间数据的文件管理模式在实现数据共享、网络通信、并发控制及数据的安全恢复机制等方面出现难以解决的问题.[8]GIS的发展要求数据库系统不仅能够存储属性数据,而且能够存储空间数据,存储和管理空间数据是GIS的核心任务之一.随着大型关系型数据库技术的日益完善,其应用也日渐普及.于是现在的GIS软件都在向集成结构的空间数据库技术方向发展,将空间数据和属性数据全部存储在关系型数据库中,使二者紧密集成,充分利用RDBMS处理和分析海量数据的能力,真正实现将图形与属性融为一体的客户/服务器结构,并与企业已有的信息系统集成.
  用RDBMS(本文采用DB2的XML存储机制)管理空间数据,主要解决存储于关系数据库中的空间数据与应用程序之间的数据接口问题,其主要任务是:(1)用关系数据库存储管理空间数据;(2)从数据库中读取空间数据,并转换为GIS应用程序能够接收和使用的格式;(3)将GIS应用程序中的空间数据导入数据库,交给关系数据库存储和管理.为此设计空间数据的关系数据库数据访问中间件,见图3,设计方案是创建1个空间数据引擎中间件连接GIS应用程序和关系数据库,从而解决存储在关系数据库中的空间数据与应用程序之间的数据接口问题.
  


  图 3 空间数据的关系数据库数据访问中间件
  
  数据访问中间件中的空间数据可以作为shape格式存储,也可以作为XML格式存储,或者作为关系数据库的一部分进行存储.中间件负责将以shape格式存储的空间数据文件自动转换为XML格式,然后将对应的XML空间数据文件存入RDBMS,其中shape文件、XML文件与RDBMS中的XML空间数据表一一对应.GIS应用可直接从中间件接口中存取shape格式的空间数据文件,也可以使用其XML格式的空间数据文件,同时完全支持从DB2 9中索取空间数据文件.
  数据访问中间件在现有RDBMS的基础上利用XML技术进行空间扩展,可以将空间数据和非空间数据集成在商用RDBMS中.其访问模式如下:对于shape文件,用户直接通过中间件接口TCP/IP下载到本地使用;对于XML文件,客户端用户通过中间件接口提出请求,中间件负责将上述XML格式的层次数据文件转换成Java类层次,并负责实例化成对象,最后将结果提交给客户端应用,至于存储于 RDBMS 中的空间数据文件,中间件负责检索用户请求的数据并封装成对象层次结构,并将搜索结果通过网络向用户的应用程序返回.上述开放式数据访问中间件模型,支持最新的标准(XPath,XQuery和SQL),提供快速、多用户的数据存取,以及开放的应用开发环境.在RDBMS中融入空间数据后,数据访问中间件模型可以提供对空间和非空间数据进行高效率操作的数据库服务.
  数据访问中间件模型具有很强的扩展性,其优势在于:(1)为不同的客户应用需求提供不同的空间数据服务;(2)通过TCP/IP横跨任何同构或异构网络;(3)提供从基于文件的系统到RDBMS管理数据系统的平滑升迁;(4)以连续、无缝的数据库管理地理空间数据;(5)跨越Internet提供公开的空间数据访问.
  从以上优势可以看出,在不同的应用中可以使用不同的空间数据,并可以根据业务的大小调整应用服务的数量和组织模式.完成数据的动态存储管理,并实现数据在不同客户应用中的实时更新.本文利用JavaBean技术已完成上述中间件的数据文件格式转换和XML空间数据文件的关系数据库存取等大部分功能.
  
  3 结 论
  
  通过对shape文件格式的分析,通过中间件将空间数据转换为XML格式的空间几何数据文件,并在关系数据库DB2 9上以XML方式存储和管理空间数据,既保留所有的空间信息,又保证空间数据和属性数据在修改时的一致性.由于所有数据均保存在关系数据库中,因此可以通过网络访问技术实现GIS数据的共享与应用.在研究与实现的过程中,发现一些问题,如存储开销增大(1个50 KB的中心线道路空间几何数据文件存储为XML文件格式需要332 KB的空间),以及数据存取速度稍慢等,下一步准备通过压缩方法解决这些问题.
  
  参考文献:
  [1] 王英杰,袁勘省,李天文. 交通GIS及其在ITS中的应用[M].北京:中国铁道出版社,2004:124-135.
  [2] POLI A,di GIOVANDOMENICO P. Dynamic and integrated GIS-RDBMS tools to develop and manage air pollutant emission inventories[J]. Epidemiology,2006,17(6):265-265.
  [3] SMIATEK G. SOAP-based Web services in GIS/RDBMS environment[J]. Environmental Modelling & Software,2005,20(6):775-782.
  [4] CHANG Yoon-seop,PARK Hyeong-dong. XML Web service-based development model for Internet GIS applications[J]. International J Geographical Info Sci,2006,20(4):371-399.
  [5] BRESSAN S,MANG C Y. A benchmark for XML processing in GIS[C] //Sixteenth Workshop on Database and Expert Systems Applications,2005:507-511.
  [6] 崔丽美,谢传节,杨联安,等.基于XML Schema地球系统科学数据的元数据扩展机制[J].测绘学报,2005,34(3):246-251.
  [7] ESRI.ESRI shapefile technical description[EB/OL].[1998]. http://www.esri.com.
  [8] 庞鲲,邢汉承. 多种非空间数据与GIS应用的集成[J].计算机辅助工程,2003,12(3):56-60.
  (编辑 于 杰)
其他文献
刘宏宇先生 2011年,MSC总部投入巨大的精力重建全球的企业生态系统,这一重大举措使MSC中国直接获益:2011年MSC中国圆满完成总部要求的增长率,使几年来徘徊不前的局面得到彻底扭转.据MSC大中国区总经理刘宏宇先生介绍,今年MSC总部要求MSC中国的业绩增长速度与2011年是相同的.从第一季度的情况看,MSC中国的业绩增长远远超出预期目标,订单越来越多,且单个订单的规模也越来越大.这尤其体
期刊
拙作虽然纯属虚构(这绝对是一句真话,小说本是想象的艺术,即使它是来自生活,有着现实生活的影子),却极欢迎对号入座(这就是小说的意义了,也是它的气场所在,无论它是形而上的还是它是形而下的)。  ——作者  给这些闲人立传,是我二十多年的愿望了,直到现在,要动笔了,却在“传”字上转不出来。  “正传?”  这些人当然应入“正传”,连阿Q都入“正传”的。  “闲人怎么能比阿Q,能与阿Q相提并论?”  “
期刊
摘要: 采用仿真与试验相结合的方法分别对3种辐板形式车轮安装新型辐板屏蔽阻尼器前后的振动特性进行分析,结果表明:在安装辐板屏蔽阻尼器后,3种车轮在整个频域范围(0~6 400 Hz)内均具有良好的减振效果;斜型辐板和双S型辐板车轮较直型辐板车轮的径向振动与1节圆轴向振动更容易发生耦合;辐板屏蔽阻尼器在有效降低3种辐板形式车轮的径向振动和0节圆轴向振动的同时,还能够减小车轮径向振动与轴向振动的耦合.
期刊
胡启明,男,1954年8月生,湖南平江人,毕业于武汉大学中文系。中国作协会员,国家一级作家,现任长沙市作协副主席。出版有散文集《返回故乡》;散文·小说集《愿你一路春风》;报告文学集《生命的歌谣》;《穿过命运的激流》;长篇报告文学《芙蓉国里尽朝晖·长沙》等五种。    楔子  被尊为中国五大淡水湖之一的洞庭湖是丰盈的,高贵的。  天上那个云波,水里的霞,八百里洞庭我的家。日从家里出,月在家中挂。浆开
期刊
刘耀儒作品  刘耀儒,原名刘跃儒,苗族。湖南沅陵县人。1999年就读于鲁迅文学院作家班。已在《芒种》《绿洲》《今天》《青年作家》《湖南文学》《北京文学》《民族文学》等国内外文学期刊上发表中短篇小说数十篇(部);出版长篇小说《非正常情欲》及中短篇小说集《伤痛故园》《山川无语》等多部。多篇(部)小说被选入《当代中国少数民族作家文库》《新时期湖南文学作品选》《精彩阅读》单行本等多种选本。部分作品获奖。创
期刊
摘要:为提高船舶设计效率,针对国际船级社协会(International Association of Classification Societies, IACS)2006年推出的散货船、双壳油船共同结构规范CSR-BC/OT,中国船级社(China Classification Society, CCS)开发出计算软件CSR-SDP. 该软件分为针对散货船的CSR-SDP(BC)和针对双壳油船
期刊
摘要:为解决管壳式换热器传热效率低下的问题,以最典型的列管式换热器为研究对象,建立换热管内置转子组合式强化传热装置的三维模型,模拟换热管内流场、温度场、压力场以及换热过程,得到管内流体的流动规律和传热性能的计算结果. 模拟计算结果显示,内置转子组合式强化传热装置的换热管内尤其是近壁区域有较强的湍流度;转子与管壁之间缝隙内的流体有明显的螺旋环绕流动,可显著提高传热系数,并具有自清洁作用. 研究表明,
期刊
摘 要:为获取鼠标按下点的造型空间坐标,利用造型空间和用户空间之间的坐标变换,基于VB实现精度可以控制的直线与圆柱体交点求解数值计算. 给出鼠标在屏幕上按下点的造型空间坐标和2点间距离的计算方法. 通过1个模型室界面,要求学生根据显示模型绘制三视图,训练学生测图和绘图. 结果表明该方法效果较好.  关键词:造型空间; 用户空间; 直线; VB  中图分类号:TP391.41  文献标志码: A  
期刊
摘 要:为便于对均匀B样条曲线进行形状修改,利用二次均匀B样条基函数所需满足的条件,扩展二次均匀B样条基函数,构造出三次多项式调配函数. 基于给出的调配函数,建立1种带形状参数的分段多项式曲线. 调整形状参数可使三次多项式曲线在二次均匀B样条曲线两侧摆动.最后给出实例,构造出带局部调节参数G1的连续曲线. 该方法可以通过调整参数扩大二次均匀B样条曲线的调整范围.  关键词:B样条曲线; B样条基;
期刊
春风贺喜无言语,排比花枝满杏园.  经过近20年的发展,中国CAE技术已取得长足进步. 中国CAE的春天已经到来,最新的CAE软件,最新的CAE技术,纷纷在中国这片肥沃的土壤里生根发芽. 这对提高促进中国自主创新能力,推进中国现代化发展起到举足轻重的作用. 针对目前CAE技术在中国各个行业蓬勃发展的大好形势,在中国CAE界进行一次总动员的时机已经成熟.  本次活动,是一次“理念传播”的总动员“论文
期刊