论文部分内容阅读
摘要:随着社会信息自动化的发展,发展实施电子政务是一种必然趋势。发展实施电子政务可以重组政府组织结构,并优化政府的工作流程,从而为建立一个高效、廉洁、公平、精简的虚拟政府提供帮助。数据集成共享问题是政府各部门不同的业务处理系统和办公系统之间急需解决的问题,同样,这也是实现虚拟政府的重中之重。数据集成的地位在电子政务系统集成中的地位是相当关键的,它是电子政务系统集成的基础。它有利于推动电子政务系统的标准化建设,同时对实现应用系统之间的协同工作有着重要的意义。本文对电子政务数据集成平台中可能采用到的XML技术进行了探讨。
关键词:电子政务 数据集成 XML
1 什么是电子政务
电子政务,英文为E-Government。它是一种通过网络技术和计算机这个平台,将政府日常的工作网络化、信息化并能标准化和服务化、公开化的,且能为社会公众及自身提供一体化的优质、高效、廉洁的管理和服务的系统工程;它可以为政府日常办公的管理和维持提供便利,并且不受时间、空间和部门的分制约。
2 数据集成在电子政务中的作用
数据集成是指通过一定的手段,将分散在各处的数据源加以整合,使其成为一个整体,给最终用户提供一个统一视图的过程。在我国,信息化系统建设在政府部门的表现通常有以下两个方面的特点。
①阶段性。它在技术上并不能一步到位。②分布性。因为受到其它经济和人为因素的影响,政府部门构建的信息系统各自有着不同的处理对象,并且操作方法和专用客户端也都不一样,分散性很强。
硬件上面,它们采用的平台往往都不是一样的。操作系统和数据库也都不尽相同。站在应用角度上,看它们就是一个互不联系没有任何牵连的异构数据源,这种状况下,就构成了一个巨大的异构数据环境,而且这种环境相当复杂。
在异构数据环境下,存在着这么一种现象。有很多应用需求根本不需要自己去进行数据的转换、结果汇总;这些需求也不必知道各数据源的分布,对数据源的结构组成也无需进行了解,但他们却可以同时访问和处理多个不同数据源中的数据。他们是怎样屏蔽掉各个层次的异构特性呢?其实很简单。他们只需要通过简便的全局查询,轻轻一按鼠标便可以得到一个令他们满意的综合结果。
这种方式,传统的数据库集成方法根本就无法做到,所以研制一种全新的数据集成系统是当下之急。这种集成方式在电子政务软件系统中的作用是显而易见的,如果上级政府需要下级政府或部门上报数据,运用这种集成方式是相当便利的,反之亦然;这种系统同时也为国家级分布式数据库系统的使用、管理和维护提供了众多便利;当然在地方在各级政府中,基层政府部门间如果需要协同办公,使用到另一个或几个部门的数据时,运用这种系统模式,可大大提高办事效率;这种电子政务软件平台能有效支持数据集成,它的方便在于可以将不同部门的电子政务应用系统及数据库有机的集成为一个整体。
3电子政务数据集成涉及到的问题
电子政务数据集成平台需要解决的问题有很多,比如异构性,自治性、共享性、透明性、分布性等等。
异构性包括系统异构和数据异构。前者主要是计算机体系结构不同,操作系统会随着计算机的不同而产生差异;后者的存储模式有多个,对象模式、关系模式、XML文档树型模式等都包括在内。这种异构主要以模式间的异构为主,数据在主流的关系模式中也是有区别的。异构性是电子政务数据集成平台面临的最主要的问题也是电子政务数据集成平台实现中的主要难点。
由于这种特性,再加上数据模型的差异,使得某个节点需要访问其它节点的数据时,很难理解其它节点的共享数据,更别说处理了。
第二需要解决的问题是自治性。各节点虽然控制着本地的数据,看似无拘无束。但它也不是绝对自由的。要想使得集成系统与节点能正常的交互,节点要保证与集成系统间的协议正常。
第三需要解决的问题就是共享性。通过共享,供集成系统或其它节点来访问时,只需提供共享数据的访问接口就行。数据集成的根基就是共享。
第四就是透明性。全局数据模型的基础上,集成平台会对节点的位置,和节点数据的用户以及访问方法等细节进行自动解析,是十分透明的。
第五需要解决的问题是解决数据源的分布性。因为依赖网络传输数据,并且异地分布,这就造成的性能和安全性问题上不能保证。
最后,数据集成平台需要解决的问题就是节点间的分布性和自治性。
集成平台现实应用中面临很多挑战,如为网络传输带来的性能和安全性问题找到保障方法;还有节点的扩展伸缩性,该采用什么方式去限制和适应。
4 异构数据库的集成
电子政务数据库集成目前主要有三个方面的解决方法和研究方向。
第一,多数据库系统。这是一种能够接受、容纳多个异构数据库的系统,对外和对外呈现不同的特性。前者呈现出一种集成的结构,后者则允许各个异构数据库的自治性。这种方法的优点是比较成熟,不足之处是还有一定的局限性。
第二,数据库迁移和转换。迁移指的是将数据移到新的数据管理系统中来,并且集成为不同类型的数据;转换是指利用数据转换程序,通过对数据格式进行转换,将一些非传统的数据类型转化成一种新的能被其它的DBMS接收数据类型。数据库迁移和转换运行时效率高,不但简单,还十分经济。数据的实时性要求不高的场合都可以运用,反之则不太适用,这是由于它数据更新时会带来不同步的问题,即使人工定时运行转换程序也只能达到短期同步这种缺憾性造成的。同样,对于数据更新频跌要求很高的场合也不太适用。
第三,用中间件。中间件系统主要集中为异构数据源提供一个高层次检索服务,为解决异构数据库的互操作性问题提供解决方案,是异构系统集成所需的粘接剂。在异构数据库系统即数据层和应用程序即应用层之间就可以找到它。向下不但可以协调各数据库系统,也为各数据库系统向上访问集成数据的应用提供统一数据模式和数据访问的通用接口;中间件系统模式是实现异构数据集成较理想的解决方案。
与第二种方法相比,它为数据更新时不同步提供了解决方案。而且更重要一点是它在集成异构数据库时,不需要改变原始数据的储存方式还有管理方式,依舊能够完成各数据库的应用任务。
5 XML在异构数据库集成方面的优势
XML (Extensible Markup Language可扩展的标记语言),是一套定义语义标记的规则。
这种文本格式被广泛接受,目前已经被应用于多领域中。
它是一种标准化的文本格式,可以在互联网上表示结构化信息。并提供了独立的运行程序的方法来共享数据,通过这种方法,可以使不同来源的数据很容易结合在一起,XML为数据的统一接口问题提供了解决方案。
它适合于表示各种信息,即能够提供对资源内容的表示,同时也提供资源所具有的结构信息。不但具有良好的可伸缩性,而且还具有良好的灵活性。
在进行异构数据集成方面,XML具有鲜明的重要特征和优势,它的主要设计目标是在Web上保存和传递信息,所以它可以直接用于互联网;它支持以全球统一的标准来定义自描述数据、将不同来源的信息集成为统一的文档和支持在各种分布应用程序之间传递信息;它是可扩展的,用户可以根据需要定义自己的标记;并且具有灵活性,它提供了一种结构化的数据表示方式,使得用户界面与结构化数据相分离;而且它的自描述性质能够很好地表现许多复杂的数据关系,使得基于XML的应用程序可以在XML文件中准确高效的搜索相关的数据内容。
参考文献:
[1]王长胜.电子政务蓝皮书:中国电子政务发展报告.北京:社会科学文献出版社,2003.1~137.
[2]Benefits of Transformational Data Integration. http://www.grcdi.nl/benefits.pdf,2001.
[3]齐艳珂,肖连,高洁.异构数据集成技术综述[J].福建电脑,2007年06期.
[4]徐向荣,顾新建,叶作亮.基于Web服务的企业应用集成研究[J].制造技术与机床,2006年09期.
[5]顾天竺等.基于XML的异构数据集成模式的研究[J].计算机应用研究,2007年04期.
关键词:电子政务 数据集成 XML
1 什么是电子政务
电子政务,英文为E-Government。它是一种通过网络技术和计算机这个平台,将政府日常的工作网络化、信息化并能标准化和服务化、公开化的,且能为社会公众及自身提供一体化的优质、高效、廉洁的管理和服务的系统工程;它可以为政府日常办公的管理和维持提供便利,并且不受时间、空间和部门的分制约。
2 数据集成在电子政务中的作用
数据集成是指通过一定的手段,将分散在各处的数据源加以整合,使其成为一个整体,给最终用户提供一个统一视图的过程。在我国,信息化系统建设在政府部门的表现通常有以下两个方面的特点。
①阶段性。它在技术上并不能一步到位。②分布性。因为受到其它经济和人为因素的影响,政府部门构建的信息系统各自有着不同的处理对象,并且操作方法和专用客户端也都不一样,分散性很强。
硬件上面,它们采用的平台往往都不是一样的。操作系统和数据库也都不尽相同。站在应用角度上,看它们就是一个互不联系没有任何牵连的异构数据源,这种状况下,就构成了一个巨大的异构数据环境,而且这种环境相当复杂。
在异构数据环境下,存在着这么一种现象。有很多应用需求根本不需要自己去进行数据的转换、结果汇总;这些需求也不必知道各数据源的分布,对数据源的结构组成也无需进行了解,但他们却可以同时访问和处理多个不同数据源中的数据。他们是怎样屏蔽掉各个层次的异构特性呢?其实很简单。他们只需要通过简便的全局查询,轻轻一按鼠标便可以得到一个令他们满意的综合结果。
这种方式,传统的数据库集成方法根本就无法做到,所以研制一种全新的数据集成系统是当下之急。这种集成方式在电子政务软件系统中的作用是显而易见的,如果上级政府需要下级政府或部门上报数据,运用这种集成方式是相当便利的,反之亦然;这种系统同时也为国家级分布式数据库系统的使用、管理和维护提供了众多便利;当然在地方在各级政府中,基层政府部门间如果需要协同办公,使用到另一个或几个部门的数据时,运用这种系统模式,可大大提高办事效率;这种电子政务软件平台能有效支持数据集成,它的方便在于可以将不同部门的电子政务应用系统及数据库有机的集成为一个整体。
3电子政务数据集成涉及到的问题
电子政务数据集成平台需要解决的问题有很多,比如异构性,自治性、共享性、透明性、分布性等等。
异构性包括系统异构和数据异构。前者主要是计算机体系结构不同,操作系统会随着计算机的不同而产生差异;后者的存储模式有多个,对象模式、关系模式、XML文档树型模式等都包括在内。这种异构主要以模式间的异构为主,数据在主流的关系模式中也是有区别的。异构性是电子政务数据集成平台面临的最主要的问题也是电子政务数据集成平台实现中的主要难点。
由于这种特性,再加上数据模型的差异,使得某个节点需要访问其它节点的数据时,很难理解其它节点的共享数据,更别说处理了。
第二需要解决的问题是自治性。各节点虽然控制着本地的数据,看似无拘无束。但它也不是绝对自由的。要想使得集成系统与节点能正常的交互,节点要保证与集成系统间的协议正常。
第三需要解决的问题就是共享性。通过共享,供集成系统或其它节点来访问时,只需提供共享数据的访问接口就行。数据集成的根基就是共享。
第四就是透明性。全局数据模型的基础上,集成平台会对节点的位置,和节点数据的用户以及访问方法等细节进行自动解析,是十分透明的。
第五需要解决的问题是解决数据源的分布性。因为依赖网络传输数据,并且异地分布,这就造成的性能和安全性问题上不能保证。
最后,数据集成平台需要解决的问题就是节点间的分布性和自治性。
集成平台现实应用中面临很多挑战,如为网络传输带来的性能和安全性问题找到保障方法;还有节点的扩展伸缩性,该采用什么方式去限制和适应。
4 异构数据库的集成
电子政务数据库集成目前主要有三个方面的解决方法和研究方向。
第一,多数据库系统。这是一种能够接受、容纳多个异构数据库的系统,对外和对外呈现不同的特性。前者呈现出一种集成的结构,后者则允许各个异构数据库的自治性。这种方法的优点是比较成熟,不足之处是还有一定的局限性。
第二,数据库迁移和转换。迁移指的是将数据移到新的数据管理系统中来,并且集成为不同类型的数据;转换是指利用数据转换程序,通过对数据格式进行转换,将一些非传统的数据类型转化成一种新的能被其它的DBMS接收数据类型。数据库迁移和转换运行时效率高,不但简单,还十分经济。数据的实时性要求不高的场合都可以运用,反之则不太适用,这是由于它数据更新时会带来不同步的问题,即使人工定时运行转换程序也只能达到短期同步这种缺憾性造成的。同样,对于数据更新频跌要求很高的场合也不太适用。
第三,用中间件。中间件系统主要集中为异构数据源提供一个高层次检索服务,为解决异构数据库的互操作性问题提供解决方案,是异构系统集成所需的粘接剂。在异构数据库系统即数据层和应用程序即应用层之间就可以找到它。向下不但可以协调各数据库系统,也为各数据库系统向上访问集成数据的应用提供统一数据模式和数据访问的通用接口;中间件系统模式是实现异构数据集成较理想的解决方案。
与第二种方法相比,它为数据更新时不同步提供了解决方案。而且更重要一点是它在集成异构数据库时,不需要改变原始数据的储存方式还有管理方式,依舊能够完成各数据库的应用任务。
5 XML在异构数据库集成方面的优势
XML (Extensible Markup Language可扩展的标记语言),是一套定义语义标记的规则。
这种文本格式被广泛接受,目前已经被应用于多领域中。
它是一种标准化的文本格式,可以在互联网上表示结构化信息。并提供了独立的运行程序的方法来共享数据,通过这种方法,可以使不同来源的数据很容易结合在一起,XML为数据的统一接口问题提供了解决方案。
它适合于表示各种信息,即能够提供对资源内容的表示,同时也提供资源所具有的结构信息。不但具有良好的可伸缩性,而且还具有良好的灵活性。
在进行异构数据集成方面,XML具有鲜明的重要特征和优势,它的主要设计目标是在Web上保存和传递信息,所以它可以直接用于互联网;它支持以全球统一的标准来定义自描述数据、将不同来源的信息集成为统一的文档和支持在各种分布应用程序之间传递信息;它是可扩展的,用户可以根据需要定义自己的标记;并且具有灵活性,它提供了一种结构化的数据表示方式,使得用户界面与结构化数据相分离;而且它的自描述性质能够很好地表现许多复杂的数据关系,使得基于XML的应用程序可以在XML文件中准确高效的搜索相关的数据内容。
参考文献:
[1]王长胜.电子政务蓝皮书:中国电子政务发展报告.北京:社会科学文献出版社,2003.1~137.
[2]Benefits of Transformational Data Integration. http://www.grcdi.nl/benefits.pdf,2001.
[3]齐艳珂,肖连,高洁.异构数据集成技术综述[J].福建电脑,2007年06期.
[4]徐向荣,顾新建,叶作亮.基于Web服务的企业应用集成研究[J].制造技术与机床,2006年09期.
[5]顾天竺等.基于XML的异构数据集成模式的研究[J].计算机应用研究,2007年04期.