基于关系数据库的XML文档存储和查询方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wangyu1221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web应用的不断扩展,基于HTML的Web信息表达方式已经不能适应人们进行信息查询和对Web数据进行管理的需要。XML以其开放性,自描述性,以及平台无关性等优点,成为网络上数据表示和交换的标准。随着XML数据的日益增多,各种类型的数据库管理方法不断出现。比较有代表性的有XML专用数据库、面向对象数据库,关系数据库等。其中,关系数据库技术最为成熟,应用也最广泛,所以把XML数据放到关系数据库中进行管理,是当前及今后很长一段时间内非常有效的手段。  鉴于XML模式和关系模式的异构性,要把XML数据存储到关系数据库,首先要进行模式的映射。XML到关系的模式映射方法可以分为以下三大类。一类方法是直接将XML文档建模,然后将模型转换为关系模式。第二种方法是基于XML模式信息如DTD,XMLSchema等,经过预处理后,使用一定的算法建立对应的关系模式。第三类方法则是基于代价的,即考虑查询负载,从而生成一个优化的关系模式。  本文主要采用了第一种方法的研究思路,原因是该方法更具有一般性,适合于所有的XML文档的存储,并且在查询性能上可以有相当不错的表现。更为重要的是,该方法提供了后两种方法实现不了的文档“无损映射”,即将文档存储到数据库以后,还能够按照文档原来顺序进行恢复。这种方法在许多文档内容管理上相当有效。  本文主要在以下几个方面进行了研究:  (1)提出了一种基于节点的对象交换模型(NOEM),可以完整的对XML文档数据进行建模,并具有较好的扩展性能;(2)提出一种新的编码方案:层次-兄弟编码(hierarchy-siblingencoding),使之既能完整的保存文档的顺序信息,又能够较好的支持XPath查询;(3)设计了四元关系模式:元素关系,属性关系,值关系和路径关系,使得该方法具有更好的通用性  实验结果表明,该编码方案可以无损的将XML数据保存到关系数据库中,并且使得XML数据的查询和重构效率较优。
其他文献
为响应国家建设“海洋强国”战略,发挥科技对海事发展的支撑和引领作用,本文提出了一个海事领域Web信息获取和分析框架MARISA(MaritimeInformation Sourcing and Analytics Fra
本文对基于SIP协议的IP电话服务器的设计与实现进行了研究。文章在深入分析研究SIP协议的基础上,提出了一种以功能插件的形式实现IP电话服务器系统的方法,并予以实现。采用本方
语音识别技术是信息技术领域的重要发展方向之一,小词汇量非特定人孤立词语音识别是语音识别领域中一个具有广泛应用背景的分支,在家电遥控、智能玩具、人机交互等领域有着重要
随着信息技术的发展,当前基于构件的软件开发正在被越来越广泛的应用。构件技术是面向对象技术的进一步发展,它适应了软件的大规模、短周期的开发需要,使人们能够在不同语言
随着计算机,网络和通信技术地发展,实时系统越来越多得被应用于工业控制、网络通信、实时监控,多媒体等领域。这些新的实时网络应用的出现给实时系统地发展提出了新的要求和挑战
本文对软件内建自测试中的测试点与测试用例进行了研究。文章重点探讨了C语言程序的测试点的设置策略,即在程序的适当位置插入测试点。在测试点的设计上是基于不同的故障模型
近年来生物特征识别技术成为了计算机科学及相关领域的应用热点,围绕着人体的各种生物特征信息,如指纹、掌纹、人脸、虹膜和步态等等,科研工作者针对它们的计算机识别算法进行了
垃圾邮件的泛滥是世界各国迫切需要解决的问题。垃圾邮件一方面使普通用户不堪其扰,另一方面,也造成了互联网资源的极大浪费,甚至于危害国家的政治及社会秩序。本文以垃圾邮件作
随着网络越来越普及,所需的全局IP地址也越来越多,这将势必大力推动IPv6协议的发展。而使用网络地址端口翻译-协议翻译(NAPT-PT),是现阶段实现V6节点和V4节点通信的重要方法之一。
随着技术的进步及互联网产业的发展,以智能手机为代表的智能化设备进入了蓬勃发展的时期,相关软硬件产业也在智能化的浪潮中不断进行着革新与技术突破。智能电视是家电智能化