论文部分内容阅读
可扩展标记语言(eXtensible Markup Language,XML)具有平台无关性、自描述性、简单性等优点,它已迅速发展成为Internet上数据表示和交换的标准。互联网上XML数据的不断增长,使有效存储、管理和查询这些数据,成为一个值得研究的课题。关系数据库具有数据管理能力强、数据安全程度高、并发访问机制稳定可靠等优势,因此,为了充分利用现有关系数据库的成熟技术,人们开始研究XML文档映射到关系数据库的方法和技术,从而实现XML数据的存储和查询。然而,由于XML数据模型与关系数据模型的差异,因此,如何在关系数据库中更为有效地存储和查询XML文档,给传统的数据库技术带来了许多新的挑战。
本文分析了现有两类基于关系数据库的映射方法——结构映射方法和模型映射方法,针对现有映射方法普遍存在查询效率不高,文档更新困难等问题,提出一种新的基于关系数据库的XMI,文档模型映射方法(NeW Model Mapping Scheme for XML Documents,NMMSX)。该方法不仅可以无损的保留XML文档的结构,而且可以显著提高复杂路径查询效率并支持XML文档更新。具体来说,本文的主要工作体现在以下几个方面:
(1)系统研究了基于关系数据库的XML存储方法——结构映射方法和模型映射方法。在模型映射方法的基础上,提出一种新的基于关系数据库的XML存储方法——NMMSX。该映射方法能够很好的保持XML文档的结构,并支持任何结构良好的XML文档。
(2)根据NMMSX的存储结构,提出不同查询路径表达式下的查询处理方式及查询算法;根据分析现有的映射方法对XML文档更新支持的不足,提出NMMSX方法的文档更新策略及更新算法。
(3)设计并实现了一种基于关系数据库的XML存储和查询系统——NMMSX原型系统。实验结果表明该原型系统具有较高的文档查询和更新效率。