论文部分内容阅读
XML已成为Web上数据表示、集成和交换的标准,它的格式简单、自我描述能力强,实现了内容、结构和表现三者的分离,更适合于数据表示和交换。近年来,XML在各个领域得到了广泛的使用,Web上已经涌现了大量的XML数据。为了有效地加工、分析和处理XML数据,国内外学者已经提出了各种XML的查询语言和存储管理技术。由于关系数据库是目前最成熟的一种数据管理技术,在存储和管理XML数据的各种方式中,基于关系数据库的XML数据存储和处理技术显然是一种可行而有效的方式,并在学术界受到了广泛的关注。然而,由于数据模型的差异,利用关系数据库存储和查询XML数据给传统数据库技术带来了许多新的挑战。 本文对XML数据的关系存储、路径表达式的查询处理等方面进行了深入的研究和探讨,提出了一种新的利用关系数据库存储和查询XML数据的方法,这种方法将XML文档树中有文本值的节点和无文本值的节点分别存储在两个关系表中,它不关心文档DTD的模式信息,也不需要建立任何索引结构。具体来说,本文的主要工作如下: (1)提出了一种新的基于路径的XML数据的关系存储方法。这种方法完整无损地记录了XML文档中的各节点信息、边信息和值信息,即在关系表中存储XML文档中各元素的name、id、parentid、level以及所有有值元素/属性的路径,加快了查询处理的速度。 (2)针对这种存储结构,提出了新的基于表连接的查询转换算法。