论文部分内容阅读
在网络数据交换日益增多的今天,XML作为一种半结构化数据以其简单易标记和跨平台等优点被越来越广泛的应用到数据存储和数据传输领域。XML数据库是一项在最近几年发展起来的新技术。同关系数据库一样,在XML数据文档中由其模式定义形成的树型结构可能包含数据冗余,引起这些数据冗余的根本原因是因为其中包含函数依赖。目前对于XML函数依赖的研究并不多,基于XML Schema模式的研究就更少,而研究XML函数依赖是进行XML数据库技术中其他相关研究的基础,本文对于XML函数依赖的研究主要是基于XMLSchema模式的,通过对由XML Schema定义所形成的XML文档的树型结构进行分析,借用树元组的概念代替关系模式中属性元组的概念,得出关于XML函数依赖的形式化定义,利用数据库体系的Armstrong公理系统推导出函数依赖的推理规则集,并对推理规则集进行证明。在本文中基于给定的XML Schema函数依赖的形式化定义给出了在XML函数依赖中关于传递函数依赖以及间接函数依赖的定义,使用元素创建规则以及元素提升规则对原有XML Schema模式进行修改,以消除其中的间接函数依赖和传递函数依赖,以此实现对基于XML Schema的XML文档进行规范化处理。在本文的第五章中还给出了XML函数依赖蕴涵和覆盖的定义,求出了最小函数依赖,转换成关系模式并证明所得到的关系模式符合第三范式的要求。