【摘 要】
:
XML(可扩展标记语言),作为网络上数据表示和信息交换的工具,以其自描述性、独立于平台等特点,已经成为新一代的网络语言。随着XML的广泛应用,XML上的索引及其相关技术的研究
论文部分内容阅读
XML(可扩展标记语言),作为网络上数据表示和信息交换的工具,以其自描述性、独立于平台等特点,已经成为新一代的网络语言。随着XML的广泛应用,XML上的索引及其相关技术的研究就显得十分重要。本文以解决XML最重要的结构索引——F&B索引在实际应用中的问题为目标,就F&B索引的创建、存储、执行查询等问题进行了研究。本文的工作及主要贡献包括如下几个方面:首先,从节省内存空间的角度出发,针对XML树模型和有向无环图模型,分别提出了新的F&B索引创建算法SAJ和SAM。理论分析表明树模型上的SAJ算法的空间性能优于现有的算法,有向无环图模型上的SAM算法的时间、空间性能均优于现有的算法。实验结果表明这两个算法是正确、高效的,并且有良好的可扩展性。其次,着眼于F&B索引使用中占用内存空间过大的问题,基于聚簇的思想,提出了一种新的基于磁盘的F&B索引结构——EDF&B索引,大大节省了使用F&B索引所占用的空间代价。实验结果表明,该索引结构的冗余量很小适合实际应用。最后,将现有的F&B索引查询处理算法扩展到EDF&B索引上,提出了基于EDF&B索引的新的查询处理算法,并用实验验证了该算法的高效性和EDF&B索引的有效性。
其他文献
图像压缩技术是多媒体技术研究的重点问题,其中嵌入式零树小波压缩算法又被认为是迄今为止最有效的压缩算法,但因为压缩过程是一个耗时的过程,所以为了更好地扩展嵌入式零树
由于量子计算有可能从根本上超越经典计算机的计算能力以及在信息处理方面的巨大潜力,量子计算机吸引了越来越多的人对其进行研究。量子电路作为量子计算机的一个基本计算模型
随着数字音乐技术的迅猛发展和手机等移动设备存储容量的增加,如何快速、有效地检索音乐信息成为迫切需要解决的问题。传统基于文本的检索方法,只能对有标注的数据信息进行检索
信息产业经过十几年的快速发展,软件系统的复杂度逐渐变高,系统集成的规模逐渐变大,造成了项目不成功的概率逐渐增高,怎么样将软件项目的失败率降低成了目前业界迫切需要攻破
随着Internet的发展,P2P网络作为一种新的网络应用模式,在工业界和学术界都受到了广泛的关注。当前,P2P网络中的搜索技术由于其灵活性和对动态环境的适应性,己经成为P2P网络
烧结为高炉炼铁提供原料,烧结矿产量的高低、质量的优劣都将直接影响到炼铁生产的产量、质量及能源消耗。烧结终点是烧结结束时的位置,作为判断烧结过程的重要参数之一。烧结
由于无线传感器网络节点计算能力、通信能力和能量供应能力的局限性,大规模、高密度传感器网络对路由拓扑控制提出了很高的要求。良好的拓扑结构,能够提高路由协议和MAC协议的
随着货币的电子化发展,信用卡在银行业务中所占的比例越来越大。信用卡业务的开发、应用、服务、管理的水准直接关系到银行的经济收益。通过对信用卡业务数据的分析、挖掘,可以
近年来随着万维网甚至企业内联网内信息量的不断增加和人们对个性化搜索的需求的增大,文本体裁分类在计算语言学中的重要性逐渐得到体现,文本体裁自动分类问题已成为当前计算语
背景差分是目前视频领域中运动检测最常用的一种方法,主要思想是比较视频图像序列中的当前帧和背景参考模型来检测目标,但是受内外条件变化的干扰,存在虚警、相机抖动等许多