论文部分内容阅读
摘要:eXtensible Markup Language,简称XML,已革命性的改变了以Web为基础的网络应用,XML提供并實现了系统分层、平台独立、资源整合等基于网络的软件应用模式。本文对XML产生的原因、优势、应用进行了较全面的介绍和分析,并就可能的前景作出了估计。
关键词:可扩展标记语言;可扩展样式语言;电子数据交换;数据定义;电子商务
中图分类号:TP311文献标识码:A文章编号:1009-3044(2007)03-10675-01
1 产生的必然性
随着Internet和web技术的发展,越来越多的数据需要通过通用网络传输,这些数据必须转换为串行化格式,正确的发送、接收并解读这些串行化数据需要一个全球性的标准,使系统开发者不用费心设计数据交换的格式,而把精力专注于更重要的问题上。
20世纪80年代,各企业都忙于展开各种各样的信息格式时(比如微软的RTF),而SGML作为HTML和XML技术的前身,确立了一套长达500多页的严格的指定了信息语义的结构的格式。但如此产生的多种私有信息格式带来巨大的麻烦,网络技术的崛起使人们不得不试图寻找一种解决办法。
网络的发展使电子商务领域需要一种通用的数据传输格式。EDI(ElectronicData Interchange)信息要求必须符合结构化的格式,并且数据交换的双方必须购买专用的软件,处理和解释EDI消息,且只能在专有增值网(VAN)上传输。
此时Web页的标准语言HTML只着重于数据的显示,它的标记都是系统定义的,用户无法自定义所需的标记,每次改版就会增加一些新的标记,如此使得HTML变得非常庞大而且复杂。
这些都期待着XML的出现,它没有让人失望。XML 1.0 版本标准由W3C正式批准公布于1998年1月10日。孕育而生的XML着重于数据结构的描述,而将数据的显示搭配适当的格式,将数据结构与数据显示分隔开,从而简化了XML文件的复杂度,也使得它的应用更宽广。XML作为SGML的子集合,XML删除了SGML较复杂的部分。而保留较简易的部分,XML和SGML一样允许用户自定义所需要的标记,这使得XML有较佳的扩充。
2 XML的优势
2.1 简单性
HTML以其简单性迅速被人们所接受,原因在于语法的简洁和开发工具的方便和通用性。XML的语法和HTML非常相似,用开发工具去处理含有XML标志的文件,或欲转换成HTML格式的文件也都非常简单。
2.2 自叙性和可扩展性
XML是一种可扩展的标记语言,即用户可以也必须定义自己的标记从而定义自己的数据结构,达到自叙的目的,同时也具有了可扩展性,使它成为一种定义兼储存的结构格式,有无限延伸的潜力。
2.3 内容与显示分离
数据存储格式不受显示格式的制约。如果需要改变文档的显示方式,只要修改样式单文件就行了。XML的自叙性使它能够很好地表达作者的意图,表现许多复杂的数据关系,也使得基于XML的应用程序可以在XML文件中准确高效的搜索相关的数据内容。并允许对不同用户作不同的呈现,而不改变数据格式。
2.4 数据中间件能力
XML最大的优势在于可以描述和集成来自多种数据库、web服务以及其它应用程序的不同格式的数据,提供了一套跨平台,跨网络,跨程序语言的数据转换平台。XML是结构化的数据,所以要储存或是要在数据库和数据库之间交换时,都非常容易。
2.5 人机互动
允许个人、组织建立适合自己需要的文档类型定义(DTD),并可以迅速的投入使用。这一特征使得XML可以针对不同的系统提供简单、独立、廉价且丰富的解决方案。
3 XML的应用
3.1 电子商务
XML的人机互动式架构提供了使用者与计算机之间的互动交流,利用其可延展性及自叙性,定单、发票、信用证、保险单等业务数据以XML格式在厂商和消费者之间进行网络传输传输的。结构化的XML文档发送至Web的数据可以被加密,并且很容易附加上数字签名。与传统的电子数据交换(EDI)格式相比,XML 提供了安全性等诸多优点,而不仅是可以在传输中进行格式的转换。
3.2 Web 应用
Web页常用的3种技术模型为静态网页、基于模板的动态信息发布、基于模板的静态信息发布,它们的应用和发展都将和XML息息相关。将大量运算负荷分布在客户端,客户根据自己的需求选择和制作不同的应用程序以处理数据,而服务器只须发出同一个XML文件。基于SOAP的Web服务,JAVA的Struts、StrutsCX等项目的产生和广泛使用都证明了XML的实用性。由于XML在网络中的普通使用,有望成为数据和文档交换的标准语言。
3.3 数据库操作
利用XML可方便的通过SQL查询存储到XML数据集(一般使用DOM:Document Object Model),并可以通过XML记录更新数据库。这种三层数据层、功能层、表示层模型(详见《基于XML的三层C/S模型》)可以减少数据库的负载和传输时间,并方便的管理远程数据。客户需要与不同的数据源进行交互时,数据可能来自不同的数据库,都有各自不同的复杂格式。
3.4 分布式和嵌入式系统。
通过XML,可架设复杂多平台的应用程序,这种格式上的通用性有利于不同操作系统之间的信息交流。加上XSL(eXtensibleStylesheet Language)的帮助,使广泛的、通用的分布式计算成为可能。由于XML和SAX(Simple APIs for XML)的小巧性,可作为管理或应用模式,参与嵌入式系统的开发和配置。
3.5 数据集成
来自不同应用程序的数据也能够转化到XML这个统一的框架中,进行交互、转化和进一步的加工。可以在同一个使用者界面上接入不同厂商的电子商品目录信息,数据的搜寻变得更为精确快速,不同系统间可以流畅地互通,不同网站之间的数据得以动态共享,强化了使用者与系统之间的聚合性。
4 XML的前景
在这样一个百家争鸣的网络时代,计算机应用领域需要用于数据交换的标准语言。XML的产生和发展都具有划时代的意义,它在数据操作中的平台、桥梁作用和JAVA、.NET等的配合使它在网络应用中逐渐被大家所熟悉和接受,随之带来了新的Web分层体系。Web服务和操作系统《中国软件产业发展战略研究报告》提出,XML将是中国软件产业的机会,XML、SOAP、UDDI等工业标准的Web服务将是今后软件的方向,事实上J2EE配合XML仍然可能是未来的主流。J2ME+XML在嵌入式系统中将继续占有一些优势。目前已经实现的简单数据的表示和交换:SAX(针对XML的简单API)和(DOM)文档对象模型,DTD(文档类型定义)和Schema(概要);面向消息的计算:XML-RPC(远程过程调用),SOAP协议(简单对象访问协议),ebXML(电子化业务XML);用于表示用户界面:XSL(可扩展样式表语言),XSLT(可扩展样式表语言转换)等应用的产生和发展使得各种架构中可集成XML的解决方案,从而形成强大的系统架构和灵活的数据管理系统的结合。虽然XML还存在着一些缺陷,但仍很有可能作为一种提交和发布的文档标准在更多的领域被广泛使用。
参考文献:
[1]邓东华, 杨宗凯, 乐春晖. 基于XML的三层C/S模型[J]. 计算机系统应用,2001.3.
[2]互联网实验室. 中国软件产业发展战略研究报告[R]. 2006.
[3]程炜,杨宗凯,乐春晖. 基于Web Service的一种分布式体系结构[J]. 计算机应用与研究,2002.3.
[4]W3C. Extensible Markup Language(XML) 1.0[S].1998.2.
[5]Matthew MacDonald. Microsoft. .NET Distributed Application: Intergrating XML Web Services and .NET Remoting[M]. 2003.
[6]Elliotte Rusty Harold. Effective XML: 50 specific ways to improve your XML[M]. 2004.
本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。
关键词:可扩展标记语言;可扩展样式语言;电子数据交换;数据定义;电子商务
中图分类号:TP311文献标识码:A文章编号:1009-3044(2007)03-10675-01
1 产生的必然性
随着Internet和web技术的发展,越来越多的数据需要通过通用网络传输,这些数据必须转换为串行化格式,正确的发送、接收并解读这些串行化数据需要一个全球性的标准,使系统开发者不用费心设计数据交换的格式,而把精力专注于更重要的问题上。
20世纪80年代,各企业都忙于展开各种各样的信息格式时(比如微软的RTF),而SGML作为HTML和XML技术的前身,确立了一套长达500多页的严格的指定了信息语义的结构的格式。但如此产生的多种私有信息格式带来巨大的麻烦,网络技术的崛起使人们不得不试图寻找一种解决办法。
网络的发展使电子商务领域需要一种通用的数据传输格式。EDI(ElectronicData Interchange)信息要求必须符合结构化的格式,并且数据交换的双方必须购买专用的软件,处理和解释EDI消息,且只能在专有增值网(VAN)上传输。
此时Web页的标准语言HTML只着重于数据的显示,它的标记都是系统定义的,用户无法自定义所需的标记,每次改版就会增加一些新的标记,如此使得HTML变得非常庞大而且复杂。
这些都期待着XML的出现,它没有让人失望。XML 1.0 版本标准由W3C正式批准公布于1998年1月10日。孕育而生的XML着重于数据结构的描述,而将数据的显示搭配适当的格式,将数据结构与数据显示分隔开,从而简化了XML文件的复杂度,也使得它的应用更宽广。XML作为SGML的子集合,XML删除了SGML较复杂的部分。而保留较简易的部分,XML和SGML一样允许用户自定义所需要的标记,这使得XML有较佳的扩充。
2 XML的优势
2.1 简单性
HTML以其简单性迅速被人们所接受,原因在于语法的简洁和开发工具的方便和通用性。XML的语法和HTML非常相似,用开发工具去处理含有XML标志的文件,或欲转换成HTML格式的文件也都非常简单。
2.2 自叙性和可扩展性
XML是一种可扩展的标记语言,即用户可以也必须定义自己的标记从而定义自己的数据结构,达到自叙的目的,同时也具有了可扩展性,使它成为一种定义兼储存的结构格式,有无限延伸的潜力。
2.3 内容与显示分离
数据存储格式不受显示格式的制约。如果需要改变文档的显示方式,只要修改样式单文件就行了。XML的自叙性使它能够很好地表达作者的意图,表现许多复杂的数据关系,也使得基于XML的应用程序可以在XML文件中准确高效的搜索相关的数据内容。并允许对不同用户作不同的呈现,而不改变数据格式。
2.4 数据中间件能力
XML最大的优势在于可以描述和集成来自多种数据库、web服务以及其它应用程序的不同格式的数据,提供了一套跨平台,跨网络,跨程序语言的数据转换平台。XML是结构化的数据,所以要储存或是要在数据库和数据库之间交换时,都非常容易。
2.5 人机互动
允许个人、组织建立适合自己需要的文档类型定义(DTD),并可以迅速的投入使用。这一特征使得XML可以针对不同的系统提供简单、独立、廉价且丰富的解决方案。
3 XML的应用
3.1 电子商务
XML的人机互动式架构提供了使用者与计算机之间的互动交流,利用其可延展性及自叙性,定单、发票、信用证、保险单等业务数据以XML格式在厂商和消费者之间进行网络传输传输的。结构化的XML文档发送至Web的数据可以被加密,并且很容易附加上数字签名。与传统的电子数据交换(EDI)格式相比,XML 提供了安全性等诸多优点,而不仅是可以在传输中进行格式的转换。
3.2 Web 应用
Web页常用的3种技术模型为静态网页、基于模板的动态信息发布、基于模板的静态信息发布,它们的应用和发展都将和XML息息相关。将大量运算负荷分布在客户端,客户根据自己的需求选择和制作不同的应用程序以处理数据,而服务器只须发出同一个XML文件。基于SOAP的Web服务,JAVA的Struts、StrutsCX等项目的产生和广泛使用都证明了XML的实用性。由于XML在网络中的普通使用,有望成为数据和文档交换的标准语言。
3.3 数据库操作
利用XML可方便的通过SQL查询存储到XML数据集(一般使用DOM:Document Object Model),并可以通过XML记录更新数据库。这种三层数据层、功能层、表示层模型(详见《基于XML的三层C/S模型》)可以减少数据库的负载和传输时间,并方便的管理远程数据。客户需要与不同的数据源进行交互时,数据可能来自不同的数据库,都有各自不同的复杂格式。
3.4 分布式和嵌入式系统。
通过XML,可架设复杂多平台的应用程序,这种格式上的通用性有利于不同操作系统之间的信息交流。加上XSL(eXtensibleStylesheet Language)的帮助,使广泛的、通用的分布式计算成为可能。由于XML和SAX(Simple APIs for XML)的小巧性,可作为管理或应用模式,参与嵌入式系统的开发和配置。
3.5 数据集成
来自不同应用程序的数据也能够转化到XML这个统一的框架中,进行交互、转化和进一步的加工。可以在同一个使用者界面上接入不同厂商的电子商品目录信息,数据的搜寻变得更为精确快速,不同系统间可以流畅地互通,不同网站之间的数据得以动态共享,强化了使用者与系统之间的聚合性。
4 XML的前景
在这样一个百家争鸣的网络时代,计算机应用领域需要用于数据交换的标准语言。XML的产生和发展都具有划时代的意义,它在数据操作中的平台、桥梁作用和JAVA、.NET等的配合使它在网络应用中逐渐被大家所熟悉和接受,随之带来了新的Web分层体系。Web服务和操作系统《中国软件产业发展战略研究报告》提出,XML将是中国软件产业的机会,XML、SOAP、UDDI等工业标准的Web服务将是今后软件的方向,事实上J2EE配合XML仍然可能是未来的主流。J2ME+XML在嵌入式系统中将继续占有一些优势。目前已经实现的简单数据的表示和交换:SAX(针对XML的简单API)和(DOM)文档对象模型,DTD(文档类型定义)和Schema(概要);面向消息的计算:XML-RPC(远程过程调用),SOAP协议(简单对象访问协议),ebXML(电子化业务XML);用于表示用户界面:XSL(可扩展样式表语言),XSLT(可扩展样式表语言转换)等应用的产生和发展使得各种架构中可集成XML的解决方案,从而形成强大的系统架构和灵活的数据管理系统的结合。虽然XML还存在着一些缺陷,但仍很有可能作为一种提交和发布的文档标准在更多的领域被广泛使用。
参考文献:
[1]邓东华, 杨宗凯, 乐春晖. 基于XML的三层C/S模型[J]. 计算机系统应用,2001.3.
[2]互联网实验室. 中国软件产业发展战略研究报告[R]. 2006.
[3]程炜,杨宗凯,乐春晖. 基于Web Service的一种分布式体系结构[J]. 计算机应用与研究,2002.3.
[4]W3C. Extensible Markup Language(XML) 1.0[S].1998.2.
[5]Matthew MacDonald. Microsoft. .NET Distributed Application: Intergrating XML Web Services and .NET Remoting[M]. 2003.
[6]Elliotte Rusty Harold. Effective XML: 50 specific ways to improve your XML[M]. 2004.
本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。