基于模式映射的XML与关系数据库的存储技术的研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:glosslee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着互联网的不断迅速发展,XML正迅速取代HTML成为Web上数据表示、集成和交换的标准,越来越受到人们的青睐,然而,随着互联网上发布的XML数据的不断增加,如何有效管理XML文档已成为一个十分棘手的问题。而目前最主要的数据存储方式是关系数据库,人们很自然地希望利用现有关系数据库的丰富资源和管理经验来存储XML文档,将半结构化数据转化为结构化的数据。然而由于XML数据和关系型数据在组织上的差异,从XML文档到关系数据库转换过程中存在的XML文档多值元素、递归元素以及混合内容元素的映射等难点问题一直没有得到有效的解决,主要表现为映射方法不灵活,查询效率低,丢失有用信息等,这增加了系统的开销、复杂性,影响了数据库的效率。与此同时,不同的生产厂商生产的数据库是异质的,这必然会增加开发基于XML的Internet应用的难度,不但如此,现存的方法大多数以DTD来定义XML文档模式,但是DTD缺乏对数据类型、文档结构、属性等约束的足够描述,而且对于XML的名字空间处理、扩展性、管理等方面有着完全不同的格式,因此,采用DTD作为模式的映射方法不容易实现XML文档的自动化存储和查询。另一方面,W3C组织于2001年5月正式推荐了XML Schema为XML的标准模式,XML Schema的格式与XML的格式完全相同,而且提供了更多的内建数据类型,并支持用户对数据类型的扩展,基本上满足了关系模式在数据描述上的需要。所以,XML Schema比DTD具有更强大的表达能力,更能适应不同领域的需求,更适合描述关系数据,有代替DTD的趋势。于是人们很自然的会考虑到如果可以把XML Schema模式转换成关系数据库模式,那么符合XML Schema格式的XML文档就能很容易地转换成关系数据库中的数据了。基于上述考虑,本文在介绍XML语言及相关知识、XML存储技术的基础上,根据W3C最新提出的XML Schema规范,提出了一种等价于XML Schema的数据模型S_Schema,并实现了从S_Schema到关系模式的映射算法和Xml文档到关系数据库的加载算法。通过实验可以证明,在XML文档的模式信息相对稳定的情况下,本文所提出的S_Schema映射方法在信息保持、查询效率、灵活性等方面均要优于DTD、文本和Xparent等方法。根据本文提出的思想,S_Schema方法能够很好地实现XML文档查询和存储的自动化。
其他文献
基于构件的软件开发是解决软件危机的有效途径,其中构件库具有非常重要的作用,在构件库中,构件的描述和分类方式以及检索方法是构件库的核心功能,传统的构件描述与检索方式,
随着计算机软硬件技术的发展,三维动画在计算机仿真,计算机视觉,三维重建等在各领域越来越广泛的应用。为了获得逼真的视觉效果,一方面需要网格模型的细化程度越老越高,另一
国内企业信息化建设为企业业务的展开和效率的提高带来了不可磨灭的贡献。随着站点访问量的增多,服务器负荷增加,导致页面访问延迟增加,影响了企业的工作效率,Web日志挖掘技
WiMAX系统提供了一种在城域网一点对多点的多厂商环境下,可有效地互操作的宽带无线接入手段。在现有的WiMAX系统中,物理层传输技术已经包括了随机化扰码、RS码、OFDM等等用以
随着网上信息量的增加和网络应用的扩大,有越来越多的用户借助因特网来获得自己需要的信息。用户在购买某种产品、做某件事之前,往往希望得到相关的一些评价和建议作为参考,
随着网上数字视频的急剧增加以及数字图书馆、视频点播、视频监控等大量多媒体应用的出现,如何在海量视频中快速检索出所需要的资料显得至关重要,因此基于内容的视频检索技术
学位
随着计算机技术尤其是网络技术的不断发展,越来越多的业务的处理都更加依赖于网络,对网络带宽的要求也越来越高,但是网络上许多于业务无关的网络流量却在吞噬着带宽,使正常的
1979年,R?ssler报道了第一个超混沌系统,自此,国内外学者对超混沌的研究兴趣显著提高。相对于简单的混沌,由于超混沌行为具有更强的随机性和不可预测性,使其在信息安全和保密
河北省科技基础条件网络平台(以下简称网络平台)网站由中心网站和各子网站组成。网络平台采用集中与分布相结合的方式,保证了更好地提供网络服务。中心网站包括门户网站、重
XtratuM是一个针对嵌入式实时系统领域应用的Hypervisor,XtratuM采用超微内核(Nano-kernel)结构和准虚拟化(Para-Virtualization)技术,实现了一个介于物理硬件和操作系统之间