论文部分内容阅读
随着XML数据逐渐成为数据发布和交换的标准,对XML的高性能数据管理需要越来越迫切,但由于历史原因,关系式数据还占很大的市场份额,单纯的XML数据管理并不能满足当前的需要,采用关系数据和XML数据的混合管理逐渐成为目前数据管理领域的主流趋势之一。CoSQLRX系统是关系-XML双引擎数据库系统,可以处理关系查询和XML查询。XML索引模块是CoSQLRX系统的重要组成部分之一,对加速XML查询处理起着十分重要的作用。本文着重于XML索引的研究,通过对各类XML索引技术的分析,提出并实现了CoSQLRX系统框架中的XML索引结构。 首先,介绍了XML索引的相关概念和研究工作。XML索引技术可以分为很多种类,如路径索引、值索引、结点索引等,每一类XML索引都独具特点,本文从XML索引对象的角度,主要研究了XML结构索引和XML值索引。XML结构索引针对XML文档的结构信息,包括XML文档的路径信息、XML文档的父子结点信息、XML文档的祖先/后代结点信息等;XML值索引主要处理XML文档中的文本信息,如XML文档的属性值和文本值信息。 其次,对XML索引模块的设计与实现进行了阐述。由于XML索引结构是基于XMLNative存储结构的,并采用与关系式数据查询相统一的处理框架,所以在索引模块中,设计了一个索引信息表XmlInfoRelation。本文索引结构可以看成是由XmlInfoRelation表和树型索引结构XNBTREE共同组成的,XmlInfoRelation表用于存储从XML存储结构中分析提取的XML索引数据信息,XNBTREE结构采用B-Link树结构,存储XML索引的键值和指针信息。在实现部分重点介绍了XML索引模块的实现方法。 最后,介绍XML索引模块的测试工作,并对实验结果进行了分析,指出了XML索引模块中存在的不足之处,并对XML索引模块的总体性能进行了客观的评估。总的来说,本文的索引结构,具有良好的可扩展性和通用性,能够有效的满足XML查询处理的需要。