论文部分内容阅读
XML的全称是eXtensible Markup Language(可扩展标识语言)由于具有简单、可扩展、互操作性强,开放性强等特点,正迅速成为一种与技术无关的数据交换的标准和传输格式。鉴于XML在很多领域有广泛的应用前景,许多关于XML的研究都是前沿和热点课题。例如在数据库领域,从某种意义上说XML,作为数据库使用可以自然地表示嵌套型数据,比关系型数据库具有更强的表达能力。但是由于XML索引还有很多不完善的地方,直接对XML文档的查询比在关系型数据库上的查询在效率上还差很远。学术界对XML索引技术的研究由来已久,尽管有一定的成果,但是还有很多可以改进的地方。
时态XML是为了处理在电子商务、电子政务等领域日益扮演重要角色的时态信息而产生的,是XML技术的一个新兴的研究分支。它相对于时态关系型数据库具有更直观地表达时态信息的数据模型,因此目前时态XML的主要应用是数据存储。对于提高在时态XML文档上的查询效率,传统的XML索引并不是很有效,可以说时态XML还缺乏一种专用的索引技术,在这方面的研究目前还基本上是空白的。本文将以时态XML的索引技术作为主题,以XML标准中已定义的数据模型为基础,首先讨论了经过时态扩展的XPath数据模型TXPath,修正了目前TXPath模型中不严谨的地方。然后在这个新模型上讨论的时间信息的连通关系和包含关系,并且用这两种关系创建了时态索引。时态索引可以单独构成或者和目前已有的XML索引共同构成时态XML索引。另外我们还给出了时态索引的更新方法。最后我们通过实验证实了创建的索引是可行的和有效的。