论文部分内容阅读
随着XML文档大量涌现,如何有效地管理和查询XML数据已经成为亟待解决的问题。结合数据库发展的需要,本文研究了在关系数据库中利用物化视图和查询重写技术存储和查询XML文档。基于视图的查询重写技术是查询优化的一个重要技术,利用缓存的视图结果回答新查询可以提高查询效率。因为回答新查询所需的部分极有可能包含在已计算的视图结果中,就不需要访问源数据库进行查询,能够节省查询处理时间。本文通过对物化视图、视图缓存、查询重写等技术进行研究,分析了当前存在的物化视图和查询重写方法的优势和不足。在此基础上,讨论如何利用关系数据库中缓存的物化视图来回答查询的问题,并实现了基于物化视图的XML数据查询系统原型。系统中使用扩展的模式匹配算法实现对多分支路径的模式匹配,解决了重写是否存在的问题,并通过模式匹配算法的匹配结果,来判断是否可以构造补偿表达式,通过构造补偿表达式算法得到重写结果,进而通过数据库中缓存的视图完成查询。整个系统分为三个组成部分,分别是预处理模块,查询处理模块和视图维护模块。