论文部分内容阅读
XML正在迅速成为Web上用于表示和传递数据的主要技术之一。在过去几年的发展中,XML的角色已不再仅限于联机文档保存语义的标记语言,而逐渐成为异构系统间交换数据事实上的标准格式。各种数据源把它们的数据以XML视图形式来输出,其他系统可以直接导入或者查询这些视图。因此,针对XML文档的查询语言和查询系统正成为当前的研究热点课题,无论这些XML文档是直接存储在数据仓库中还是在其他格式数据存储格式基础上产生的视图。
为了更好的查询和更新XML数据,各种用于分析、整合和转换XML数据内容的查询语言被定义出来。W3C组织在2001年1月首次公布了标准XML查询语言XQuery的工作草案,于同年6月发布修正案,最近更新版本发布时间为2002年11月。
要使XML更进一步发展成为通用的数据形式和共享格式,就必须允许用户对XML文档进行更新操作,也必须开发相应的新技术来有效处理XML文档。更新能力不仅对修改XML文档很重要,它对通过XML视图来传递变化和表示文档的变化也同样重要。在对XML及其查询语言研究的基础上,设计并实现了基于XQuery的XML有效更新方法,并给出了该方法的实验结果数据。本文的主要研究工作及成果体现如下:
1.本文在对XML查询语言研究的基础上,对当前最具有代表性的六种查询语言进行了详细的比较分析。总结了它们各自独特的和共有的特性,强调了不同查询语言侧重的任务,并对它们进行了分类。
2.本文以XML查询语言W3C推荐标准XQuery为实现底层,拓展了一系列更新操作。定义了一系列修改XML文档内容和结构的原始操作集合,给出操作的详细语义。扩展了XQuery查询语言,定义出详细的更新操作语法规范,并举例说明。
3.提出可以确保更新过程中文档“结构一致性”的增量式有效性限制条件检查,定义出一系列的有效性限制条件。在深入分析XML文档、XMLSchema文档各自内部的关系和相互间的映射关系的基础上,给出了保持XML更新过程中一致性的限制规则,并进一步将其映射到各类更新操作中。
4.XML有效更新的实现技术。a)提出一种XML有效更新操作的系统框架,并详细给出了该框架几个重要组成部分:由XQuery分析器,模板库和XQuery重写器组成的先验XQuery生成器,XQuery更新执行引擎等。并给出了这些部件的具体结构和详细功能,以及各部分的功能实现的详细方法和流程。b)给出系统具体实现细节及其实验结果。为了验证提出方法的可行性,实现了一个基于Pennsilvania大学开发的tXML查询系统——Kweelt的原型系统,扩展该系统功能使其能够实现基于XQuery的更新操作和对更新操作的增量式有效性检查。并给出了实验结果及其分析。