【摘 要】
:
如何在海量的XML数据中检索到人们需要的信息是当前学者研究的一个热点问题。结构连接是XML查询的核心操作,在对结构连接算法的改进方面有了大量的研究成果。为提高查询效率,
论文部分内容阅读
如何在海量的XML数据中检索到人们需要的信息是当前学者研究的一个热点问题。结构连接是XML查询的核心操作,在对结构连接算法的改进方面有了大量的研究成果。为提高查询效率,研究者引入了索引技术。目前的结构连接算法和索引技术依然存在着一定的问题,还有改进的空间。目前的结构连接算法需要频繁的磁盘O/O操作,XML索引技术存在着存储空间过大的缺点,在实际的应用中,不能完全发挥自身的优势。性能和占用空间大小是一对矛盾,如何采取更好的方式在二者之间达到一个平衡,是值得研究的问题。本文针对以上问题展开研究,通过建立索引来减少结构连接操作的磁盘访问次数。在查询过程中,针对包含操作过多的情况,减少无用的连接。以提高查询效率。本文工作主要包括以下几点:首先,本文提出了一种新的索引结构,在标签流的概念上,引入了标签路径,在路径索引中,标签路径和XML路径相结合,在包含操作中,只返回所在标签路径的位置,只经过一次磁盘I/O,就能输出目标节点集合。同时,引入位图,并分析比较了位图更新的代价。该索引需要较少的存储空间,在查询性能上也有良好的表现。其次,当前的索引大都不能处理包含值谓词的路径表达式,而关键字查询又没有考虑XML的路径信息。本文提出了一种基于实体语义的关键字查询方法,在处理包含谓词的路径表达式时,对相同标签的文本建立索引,采取路径匹配和关键字匹配相结合的方式,提高了查询效率。
其他文献
纹理分析是指通过一定的图像处理技术提取纹理特征参数,从而获得纹理的定量或定性描述的处理过程,在机器视觉和模式识别领域研究中占有重要地位。随着科学技术的快速发展以及
随着计算机制造技术和应用技术的不断发展,U盘、移动硬盘等移动存储设备的购置成本不断降低,由于其体积小、容量大、携带方便、不易损坏等特点而越来越受到大家的青睐。移动
随着云计算的飞速发展及其许多方面的优势(如,花费的有效性、灵活性,以及可扩展性等等),越来越多的用户将他们的应用从本地移动到云计算中心。而为了满足众多用户各式各样的需求,云
随着人工智能、计算机图形学和软硬件技术的高速发展,计算机动画已经广泛应用于工程、科研、文娱等众多领域。中科院陆汝钤院士在90年代提出了动画自动生成技术(Automatic Gene
手语是聋人之间使用的一种语言,是一种靠肢体、表情进行交流的特殊语言。它是聋人在日常工作、生活中与人交流、传达信息的最重要途径,然而现今社会中信息传播的主要方式建立
机器翻译是利用计算机把一种自然源语言转变成另一种自然目标语言的过程。机器翻译基本分为基于规则的方法和基于语料库的方法,基于语料库的方法又可以分为基于统计的方法和
随着Internet环境的不断复杂以及数量的不断增加,要求防火墙、VPN、PKI、入侵检测等技术更加的快速、高效。模式匹配能有效支持网络内容安全并提高网络设备的性能,是高速网络
本文以二维骨组织病理切片显微图像为研究对象,通过对目标图像进行分析与计算,可获得骨组织结构的计量参数,从而进一步得到骨组织形态结构变化状况。 计算机辅助识别切片的具
在电力系统中,许多功能都与时间密切相关,如果时钟不同步,系统时钟就会混乱,很多事情就会变得杂乱无章,严重的则导致整个电网瘫痪,因此电网系统中的时钟同步变得越来越重要,整个系统
安全组播是组播技术的研究热点之一,其核心就是组播密钥管理问题。组播密钥管理主要是为了解决安全组播中两个重要的难点—前向及后向安全,合法的组成员在退出组后不能再接收