XML动态更新算法CSSU的改进研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:greenplastic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML以其扩展性、结构性、平台独立性和自描述性等诸多特性,越来越多的信息采用XML格式进行存储和交换,XML已经成为Web上信息表示和交换的标准。大量XML数据的出现给XML的存储和管理带来了巨大的挑战。为了更容易的操作XML文档中的数据,专家和学者们在两个方面做了积极深入的研究:一个是更新模型的研究;另一方面是基于某种编码的更新方案和算法研究。目前已经提出了大量的编码方案和索引技术,这些方案大多数在提高对XML数据的查询性能方面取得了很大的成就。但是当XML数据需要频繁地更新时,由于这些编码方案和索引技术大都不支持XML数据的动态更新,需花很大的代价去重新编码和建立索引,严重影响了它们的效率。为此,本文在支持XML数据动态更新的编码方案和索引技术方面进行了有益的探索。   CSSU编码改变了传统编码方案主要采用数字序号进行编号的特点,采用字母、数字和下划线对结点进行编码,且按字典序来表示节点的顺序。由于插入和删除结点,不影响其他结点的编码,不需要重新编码,能满足XML动态更新的需要。但是CSSU编码长度比较大,而且当一个结点的孩子结点非常多时,会导致编码长度非常长,编码效率低,并影响查询速度。   本文在CSSU的基础上进行了改进,主要体现在两个方面:   1).将原有的基于字母的编码方案调整为基于浮点数与整型数字进行编码,这样可以在一定程度上减小编码的长度;同时采用延迟更新策略,在系统资源空闲的时候对浮点数编码进行调整为整型编码。由于整型进行比较的效率较高,这样可以有效提高XML处理的效率。   2).结合改进后编码方案,给出了新的基于路径索引的查询处理方法,可以加快查询速度,并减少早期处理过程中的搜索空间。结点编码保存了孩子双亲元素的详细信息,提高了访问元素双亲的速度。   实验表明,所给出的编码方案当XML数据需要频繁的更新时,可以很大程度上提高结点编码的效率,同时能非常有效地支持索引的更新,给出的索引算法在大多数测试查询中性能较好。
其他文献
随着生物识别技术的发展,自动指纹识别系统得到了广泛的应用。现有的自动指纹识别系统最主要的问题是:系统非常依赖于指纹图像的质量,低质量的指纹图像会造成特征的丢失或者虚假
近年来,基于构件的软件开发(CBSD)技术发展迅速,越来越受到业界的欢迎。在开发一个构件化软件时,只需把一个个现成的构件进行组装即可完成一个应用系统。CBSD能够取得成功的
隐写分析技术是信息隐藏技术的逆向技术,主要目的在于检测、提取或破坏可疑载体内藏有的秘密信息。由于网络语音流具有较大的信息隐藏容量和较高的实时性,因此网络语音流上的
互联网的出现和快速普及使得信息的获取和利用更加便捷,而信息无障碍建设使得残障人士特别是视障人士也能充分利用互联网上的资源与服务,真正实现信息社会的无差别接入。  
软件复用是指重复利用现有系统中具有相同或相近的软件元素来开发新系统的过程,它极大的提高了软件开发效率和软件质量。作为解决软件危机的有效途径,软件复用技术迅速发展,
分布式实时嵌入式系统(DRES)的安全性是系统的关键环节,而信息的传输是分布式实时嵌入式系统安全中的一个薄弱环节。随着计算机软硬件的迅速发展与网络的广泛应用,分布式实时
学位
随着计算机及网络技术的不断发展,流媒体凭借边下载边播放等优点而得到越来越充分的应用。P2P技术应用于流媒体经过近几年来的研究已不断地走向成熟,其中P2P流媒体直播系统在
随着互联网中信息爆炸式的增长,网络存储技术越来越收到人们的关注和重视。而这种网络存储技术面临的一个主要的问题就是怎样充分利用互联网中的这些曾被忽视的闲散PC资源形
近些年来,背景建模算法在计算机视觉领域得到了广泛的应用,如视频监控、目标跟踪、人体行为识别、车牌检测等。与此同时,背景建模算法的应用环境也发生了较大变化,从静止的室
随着科技发展,机器人产业的应用和需求与日俱增,人类生活各领域如工业、农业、教育、国防等逐渐出现机器人的影子。因此,机器人学是一个重要且极具广泛应用价值的研究课题。