论文部分内容阅读
【摘要】XML作为一种国际化的通用标记语言,广泛应用于IT产业的各个领域。数据交换是XML的重要应用之一,平台间的接口就常采用它来实现。数据接口一般都较为稳定,但也不尽然。本文就是为了应对XML接口格式的频繁变化,探索并提出了一种全新的解决方案,设计和研发了基于数据库的XML脚本及其实现引擎。该引擎已通过了北京同方卫康科技有限公司的测试,应用于实践。
【关键词】XMLScript数据交换语法分析器语法解析器栈
一、引言
XML是由W3C组织于1998年2月制定的一种通用语言规范。XML是SGML(标准通用标记语言)的一个子集,其最大优点在于适合网上发布和数据交换[1]。XML是目前全球范围内描述数据和交换数据的一种标准的方式。XML作为平台接口,一般数据格式都比较稳定,可以用多种技术和方式来实现它;但当数据格式变动比较频繁的情况下,每次数据格式的微小变化都必须修改源代码。本文就是以北京同方卫康科技有限公司面对北京市卫生局统计平台接口的变化为契机,提出了一种应对这种变化的通用解决方案。
二、Xml脚本引擎的设计原理
2.1XML通用设计接口
作为一种数据交换的中间件,XML具有跨平台、结构化和子描述性强的特点[2]。因此,常用XML作为系统和平台间的数据接口。设计师们通过分析数据接口的格式,从数据库或者基于数据库的数据层中产生这些数据。图1简单描述了这种通用性XML的生成过程。
2.2XML脚本引擎工作流程
由通用XML生成流程图易见,如XML数据格式变化比较频繁,哪怕只有一个微小的改动,也得修改代码。本文设计的基于数据库的XML脚本引擎,一般情况下,只需通过更新XML模板文件就能够应对这种变化;而此引擎可以作为Active DLL或者基层类库来使用。图2,展示了该引擎的工作流程图。
三、XML脚本引擎设计与实现
3.1XML脚本
在XML示例文件基础上添加一些自定义语法规则信息,我们把这些符合一定规范的附加信息叫做XML脚本(XMLScript)。
XMLScript规则制定如下:(1)脚本位置。(a)置于注释节点中;(b)置于无实际功用的描述性属性中;(c)置于Element的Text文本值中;(2)变量信息定义。(a)单变量格式:{@变量名:变量值}。(b)多变量格式:{@变量名1:变量值1;@变量名2:变量值2};(3)执行语句:(a)Sql执行语句:{@fSQL:@数据库连接变量,@r记录集变量,@Sql语句变量[;@变量|@r其他已打开记录集.字段]*};(b)删除空节点:{@fDelNullNode:true | false};(c)循环节点:{@fLOOP1:记录集};(d)自定义函数:{@f函数名:[变量]}。
3.2XMLScript模板
我们称加入了XMLScript的XML文件为XMLScript模板,即XMLScript Template。模板示例如下:
注:本示例中所采用的SQL语句是同方的工程师们在研究SQL SERVER优化机制后采用的优化形式,其功效与参数化查询不相上下,但要简练得多。
3.3XML脚本引擎
我们把通过解析和解释XMLScript模板,自动从数据库中获取指定数据的软件体系称为XML脚本引擎(DBToXMLScript Engine)。
鉴于XML的层级特点和脚本定义的语法规则,该引擎采用栈作为主存储结构。引擎加载XMLScript模板后,语法分析器逐次遍历各节点,从节点信息中提取出脚本信息,再交由语法解释器处理。该引擎采用的是边解释边执行的方式,故可视为解释型引擎,具体设计架构如图3所示。
(1)语法分析器(Parser)
语法分析器,用于分析XML模板文件,循环遍历各节点,提取出XMLScript,再把这些脚本信息交由语法解析器来处理。
(2)语法解释器(Interpreter)
语法解释器,把分析器推送过来的语法信息分类,参照该层次XML节点依次把脚本和节点信息放入不同的栈中,并依次执行“执行语句”,生成目标XML文件。
执行期间,还需记录操作日志、删除空节点、删除属性信息等。记录操作日志,可以协助调试和发现错误信息;删除空节点可以删除一些无用的记录;删除属性信息,可以减小XML文件的大小。这几项操作被设置为了可选项,但它们在开发和应用中往往是必不可少的。
除已定义好的函数外,该引擎还允许它的用户(客户端)重载自定义函数,来对从数据库中得到的数据进行加工,以满足最终平台的要求。如示例模板中的{@fDICT_GENDER:@r病人基本信息.GENDERID},由于客户医院的性别字典ID值与卫生局平台不一致,因此需要一个重载的函数DICT_GENDER来实现。
(3)栈(Stack)
按XMLScript包含的信息,栈可被分为三类:常量栈、命令栈、记录集栈。常量变量信息都存储为常量;命令栈,用于存储可执行语句信息;记录集栈,用于存储数据库查询操作返回的记录集。
XMLScript的变量采用栈作为存储结构,因此脚本的位置决定了其所在的作用域,就如同程序变量一样。首先,位于XML根节点之前的Script,其中的变量信息可被视为全局变量,最先入栈却最后出栈;再者,位于各节点间和节点属性内的Script,其中的变量信息也依次入栈,同时还必须增加辅助标记,以在该节点访问完毕后释放该节点内的变量。
3.4引擎测试与验证
该引擎只对外公开了几个属性和三个方法,但却可以完成复杂的功能。事实上,只有加载XML模板文件Load方法和保存SaveAs方法才是必须的,UserFunction方法用来扩展自定义函数,实现数据库中数据的二次处理,只有必要时才重载。
该引擎易于使用,核心测试代码如下:
DBToXML engine =new DBToXML( );
engine.Load(@“C:\template.xml”);
engine.SaveAs(@”C:\result.xml”);
运行结果如图4所示。
四、结束语
本文设计和开发了基于数据库的XML脚本及其引擎,将XML接口的易变性封装在了XML脚本模板中,只需更新模板文件就能应对接口的变化,极大的提高了开发人员的工作效率。由于该引擎直接操作数据库势必会造成性能损失,不适用于对实时性要求较高的系统。另外,SQL语句置于模板文件,模板位置可能直接影响公司数据安全,对安全性要求较高的用户需增加防护策略。
参考文献
[1]王仲,陈晓鸥.基于XML的数据交换与存取技术研究.计算机工程与应用,2001,24:108-111
[2]孙君明,郭红.基于XML的异构信息交换技术研究[J].计算机应用研究,2003,20(1):72-73
【关键词】XMLScript数据交换语法分析器语法解析器栈
一、引言
XML是由W3C组织于1998年2月制定的一种通用语言规范。XML是SGML(标准通用标记语言)的一个子集,其最大优点在于适合网上发布和数据交换[1]。XML是目前全球范围内描述数据和交换数据的一种标准的方式。XML作为平台接口,一般数据格式都比较稳定,可以用多种技术和方式来实现它;但当数据格式变动比较频繁的情况下,每次数据格式的微小变化都必须修改源代码。本文就是以北京同方卫康科技有限公司面对北京市卫生局统计平台接口的变化为契机,提出了一种应对这种变化的通用解决方案。
二、Xml脚本引擎的设计原理
2.1XML通用设计接口
作为一种数据交换的中间件,XML具有跨平台、结构化和子描述性强的特点[2]。因此,常用XML作为系统和平台间的数据接口。设计师们通过分析数据接口的格式,从数据库或者基于数据库的数据层中产生这些数据。图1简单描述了这种通用性XML的生成过程。
2.2XML脚本引擎工作流程
由通用XML生成流程图易见,如XML数据格式变化比较频繁,哪怕只有一个微小的改动,也得修改代码。本文设计的基于数据库的XML脚本引擎,一般情况下,只需通过更新XML模板文件就能够应对这种变化;而此引擎可以作为Active DLL或者基层类库来使用。图2,展示了该引擎的工作流程图。
三、XML脚本引擎设计与实现
3.1XML脚本
在XML示例文件基础上添加一些自定义语法规则信息,我们把这些符合一定规范的附加信息叫做XML脚本(XMLScript)。
XMLScript规则制定如下:(1)脚本位置。(a)置于注释节点中;(b)置于无实际功用的描述性属性中;(c)置于Element的Text文本值中;(2)变量信息定义。(a)单变量格式:{@变量名:变量值}。(b)多变量格式:{@变量名1:变量值1;@变量名2:变量值2};(3)执行语句:(a)Sql执行语句:{@fSQL:@数据库连接变量,@r记录集变量,@Sql语句变量[;@变量|@r其他已打开记录集.字段]*};(b)删除空节点:{@fDelNullNode:true | false};(c)循环节点:{@fLOOP1:记录集};(d)自定义函数:{@f函数名:[变量]}。
3.2XMLScript模板
我们称加入了XMLScript的XML文件为XMLScript模板,即XMLScript Template。模板示例如下:
注:本示例中所采用的SQL语句是同方的工程师们在研究SQL SERVER优化机制后采用的优化形式,其功效与参数化查询不相上下,但要简练得多。
3.3XML脚本引擎
我们把通过解析和解释XMLScript模板,自动从数据库中获取指定数据的软件体系称为XML脚本引擎(DBToXMLScript Engine)。
鉴于XML的层级特点和脚本定义的语法规则,该引擎采用栈作为主存储结构。引擎加载XMLScript模板后,语法分析器逐次遍历各节点,从节点信息中提取出脚本信息,再交由语法解释器处理。该引擎采用的是边解释边执行的方式,故可视为解释型引擎,具体设计架构如图3所示。
(1)语法分析器(Parser)
语法分析器,用于分析XML模板文件,循环遍历各节点,提取出XMLScript,再把这些脚本信息交由语法解析器来处理。
(2)语法解释器(Interpreter)
语法解释器,把分析器推送过来的语法信息分类,参照该层次XML节点依次把脚本和节点信息放入不同的栈中,并依次执行“执行语句”,生成目标XML文件。
执行期间,还需记录操作日志、删除空节点、删除属性信息等。记录操作日志,可以协助调试和发现错误信息;删除空节点可以删除一些无用的记录;删除属性信息,可以减小XML文件的大小。这几项操作被设置为了可选项,但它们在开发和应用中往往是必不可少的。
除已定义好的函数外,该引擎还允许它的用户(客户端)重载自定义函数,来对从数据库中得到的数据进行加工,以满足最终平台的要求。如示例模板中的{@fDICT_GENDER:@r病人基本信息.GENDERID},由于客户医院的性别字典ID值与卫生局平台不一致,因此需要一个重载的函数DICT_GENDER来实现。
(3)栈(Stack)
按XMLScript包含的信息,栈可被分为三类:常量栈、命令栈、记录集栈。常量变量信息都存储为常量;命令栈,用于存储可执行语句信息;记录集栈,用于存储数据库查询操作返回的记录集。
XMLScript的变量采用栈作为存储结构,因此脚本的位置决定了其所在的作用域,就如同程序变量一样。首先,位于XML根节点之前的Script,其中的变量信息可被视为全局变量,最先入栈却最后出栈;再者,位于各节点间和节点属性内的Script,其中的变量信息也依次入栈,同时还必须增加辅助标记,以在该节点访问完毕后释放该节点内的变量。
3.4引擎测试与验证
该引擎只对外公开了几个属性和三个方法,但却可以完成复杂的功能。事实上,只有加载XML模板文件Load方法和保存SaveAs方法才是必须的,UserFunction方法用来扩展自定义函数,实现数据库中数据的二次处理,只有必要时才重载。
该引擎易于使用,核心测试代码如下:
DBToXML engine =new DBToXML( );
engine.Load(@“C:\template.xml”);
engine.SaveAs(@”C:\result.xml”);
运行结果如图4所示。
四、结束语
本文设计和开发了基于数据库的XML脚本及其引擎,将XML接口的易变性封装在了XML脚本模板中,只需更新模板文件就能应对接口的变化,极大的提高了开发人员的工作效率。由于该引擎直接操作数据库势必会造成性能损失,不适用于对实时性要求较高的系统。另外,SQL语句置于模板文件,模板位置可能直接影响公司数据安全,对安全性要求较高的用户需增加防护策略。
参考文献
[1]王仲,陈晓鸥.基于XML的数据交换与存取技术研究.计算机工程与应用,2001,24:108-111
[2]孙君明,郭红.基于XML的异构信息交换技术研究[J].计算机应用研究,2003,20(1):72-73