基于纯XML数据库Natix系统存储技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:wsqwsqwsqwsq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML相关标准的推广与应用,Web上出现了大量的XML文档。为了有效的管理,有必要将XML文档存储到数据库中。存储方案已成为XML数据管理领域研究的一个重要课题。纯XML数据库充分考虑到XML数据的特点,以一种自然的方式来处理XML数据,能从各方面很好地支持XML的存储和查询,并且能够达到较好的效果,所以纯XML数据库存储是很有研究价值的。 本文从XML和纯XML数据库等基础知识入手,分析了XML数据在原生数据库的存储方式,并深入研究了纯XML数据库Natix系统。发现其中存在的问题,记录之间往往要保存一定数量的“结构信息”以保证数据还原的正确性,这就使得记录之间不是相互独立的,记录间的不独立将会影响到XML更新的效率。本文针对Natix系统不足之处进行改进,将改进后的系统命名为NatixUp系统,它可以完全保留XML树结构信息,同时具有如下特点:为便于查询结点结构信息并有效支持更新,对XML文档数据给出基于前缀整除的编码方案;存储记录间相互独立,进行更新时可以减少XML存储及索引的修改,减少了更新的代价;并给出一种基于空间利用率的XML存储更新算法及基于父子关系聚簇的分裂子树算法。NatixUp系统能够从理论上有效的支持更新。 最后,通过实验对NatixUp系统进行了验证,实验结果表明,NatixUp系统和Natix系统相比较具有较高的更新效率。
其他文献
Ad hoc网络是指在没有固定基础设施的情况下,由具有无线通信功能的节点自组织形成的多跳的无线网络。它适用于需要临时架设网络的场所,具有广阔的发展前景。在Ad hoc网络中,
无线传感器网络(Wireless Sensor Networks,WSN)是集无线通信、嵌入式计算于一体的新兴的分布式自组织数据采集网络,通常布设在特定的区域完成一些特定的功能。在军事、环境
生物网络模块化结构识别和人类疾病基因预测在生物信息学领域具有重要研究价值。本文从蛋白质相互作用网络的拓扑特征出发,认为网络中节点的模块归属性可以由它的周围邻居节
随着计算机网络和数字技术的快速发展,传统媒体逐步向数字媒体转变,出现了越来越多的数字作品。但是,数字作品易于篡改、易于复制,使得盗版问题非常严重。因此,设计安全、有效的数
随着信息技术的飞速发展,许多领域产生的数据是在时间维度上严格有序、在数值上不断变化的无限的数据序列,由此产生数据流模型。数据流频繁项集挖掘作为数据流挖掘的一个新兴
近几年来,随着计算机网络及分布式系统的大量应用,网络入侵的方式层出不穷,计算机网络的安全问题越来越成为人们广泛关注的焦点。传统的安全技术,如入侵防御和入侵检测技术无
在玻璃的生产线上,不允许玻璃上出现大量的明显的缺陷,否则会影响其质量。因此,开发一套低成本的玻璃检测系统便有极大的科研价值。本文所做的工作就是为一厂家开发检测系统
一般地,在进行对象建模时通常有两种模式:基于统计的方法和基于结构的方法。在统计模式识别中,研究对象常表示为特征向量。特征向量的表示形式具有数学运算上的优势,但另一方
网络的快速发展,网络设备的增加和拓扑结构的复杂,使网络安全问题变得日益突出。网络安全管理技术需要进一步的发展,网络安全管理平台就是在这种情况下出现的一种新型的网络
自动人脸识别是当前模式识别领域中的一个极具挑战性的研究课题,因其在法律、商业、军事等领域具有广泛的应用前景而日渐受到各国政府以及科研单位的广泛关注和高度重视。如