论文部分内容阅读
由于XML正日益成为互联网上事实上的数据存储、交换、表示的标准。随着XML应用的普及,对XML文档查询的要求也越来越高。传统的关系型数据库由于关系模型本身的局限性,不能很好的表示XML数据,同时SQL,OOL等传统的查询语言也不能很好的利用:XML文档的结构信息。
本文以研究Native XML数据库中集成索引查询技术为主,同时也研究了NativeXML数据库的相关技术。文中对Native XML数据库中各种索引结构进行了详细的研究,并且提出了一种新的XML文档集成索引结构。最后实现了一个Native XML数据库原型系统一XSQS(XML Storage and Query System)。
本文主要工作如下:
1.原型系统XSQS(XML Storage and Query System)。为了更好的研究NativeXML数据库系统,同时也为了验证本文提出的集成索引及相应的查询处理技术,本文在上述研究成果的基础上实现了一个Native XML数据库原型系统-XSQS。该系统可以存储和处理XML文档,并且对于复杂的查询有较好的效率。
2.XML文档编码方式。在研究了各种流行编码编码模式之后,根据集成索引的需要,在XISS区间编码的基础上进行修改,提出了XSQS系统编码方式。在XSQS中,我们也采用该模式为简化的DTD树模型进行编码。
3.XSQS集成索引。为了提高XML数据的查询效率,人们致力于研究XML索引结构。本文设计一种新的XML索引结构,该结构利用我们XSQS设计实现的XSQS编码方式,集成结构摘要类索引与节点记录类索引的优点利用DTD结构信息来建立XML的结构索引,然后利用结构索引中的DTD的结构信息设计一种新的集成索引。同时我们在集成索引中也集成了Element索引跟Attribute索引等索引,这样不仅满足了节省了索引占据的空间,减少了维护和更新等各种代价,同时可以满足我们的某些特殊的查询需要。
最后我们利用Shakespeare’s Play、DBLP等Benchmark数据对本文提出的一些方法进行检验,可以体现出性能是比较好的。