论文部分内容阅读
随着网络技术和网络服务的飞速发展,XML(eXtensibleMarkupLanguage)越来越多地活跃在数据交换和存储领域。大量XML数据的出现,要求数据库具有更有效的XML数据管理能力和更快、更精确的XML数据查询能力。NativeXML数据库由此应运而生,它以一种自然的方式来存储和管理XML数据。存储和查询XML数据是NativeXML数据库的主要功能,因此,相关的底层技术如编码方案、存储方案和索引方案都对数据库的性能起着关键的作用。
本文在分析总结国内外已有的NativeXML数据库研究成果的基础上,对NativeXML数据库的编码方案进行了深入的研究,提出了一种新的编码方案XDN,这种编码方案具有前缀性和字典有序性,能够有效地支持各种XML查询,并且具有很好的动态性和较短的编码长度,在更新操作之后不需要重新编码;在XDN编码方案的基础上,给出了一种采用分页存储策略的细粒度存储方案,它使用B+树结构来实现快速确定XML结点的存储位置,具有较好的XML文档存取性能;根据XDN编码方案和相应的存储方案,给出了一种包含值索引和结点索引的索引方案,它使用B+树结构的变体来建立索引,大大减少了访问磁盘I/O的次数;最后还探讨了基于这些底层技术的查询处理方案,给出了各种结构连接算法。