论文部分内容阅读
随着互联网技术的发展,XML已经成为数据表达和交换的新标准。各行各业都积极采用XML格式表示其数据和信息,借助于XML,Web正逐步转化为一个巨大的数据库。由于XML信息量的剧增,对XML信息管理技术的需求也就应运而生。为此,传统的数据库厂商纷纷提供各种支持XML数据的扩展和插件,同时,为XML数据管理量身打造的XML原生数据库系统也不断涌现。其中XML原生数据库在处理层次关系丰富、结构化程度不高的应用时具有独特的优势,在近几年得到了研究者的广泛关注。然而,从数据库的角度,现有的XML原生数据库产品还远非完善。对数据更新的支持不足一直是其最大的弱项之一,XML原生数据库系统中的XML事务处理及并发控制技术亟待加强。 目前关于XML事务处理的研究尚处于起步阶段,虽然有一些研究人员已经提出了一些并发控制协议,但仍缺乏一个成熟的事务模型,本文提出的通用的XML事务模型正解决了这一问题。该模型使用一致的操作模型统一了对DOM、XPath和路径索引检索等XML常用访问模式。同时,针对XML应用对节点次序的要求不同,本文首次明确提出了强弱两类可串行性概念。借助于这一操作模型和强弱可串行性概念,就在理论上统一了对XML文档的并发控制和对路径索引的并发控制。因此,本文提出的模型无论在完整性还是通用性上都在现有的工作基础上有很大提高。对XML调度器的实现及各类操作冲突检测的复杂度,本文也都做了深入细致的分析。根据分析的结果,本文提取出一个既能保证实现有效性,又能充分利用XML操作语义信息的XML核心操作模型。这些工作为文本后续研究奠定了艰实的基础。 基于本文提出的XML事务模型、操作模型与可串行化理论,本文提出了两个充分利用了XML核心操作语义的协议:MSPX-w和MSPX-s,分别实现了弱可串行性和强可串行性。MSPX系列协议结合了多版本并发控制和语义并发控制两个技术的优点,使用路径锁、区域路径锁等技术最大限度的提高了系统并发度。同时,得益于本文对XML调度器实现复杂性的分析,MSPX系列协议在设计时就立足于对XML核心操作模型的处理,保证了协议的运行效率。 最后,针对XML并发控制协议中加锁操作过多,锁粒度过细的问题,并充分利用了XML数据层次关系丰富的特点,本文提出了自适应粒度锁调度器技