XML复杂路径表达式查询处理技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:zxqzxm88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了如何将具有各种运算符的正则表达式转化为查询自动机的方法.针对XPath规范中规定的"∥"操作符,即祖先—后代关系操作符,我们提出了一个称为模式自动机(Schema Automata)的数据结构,模式自动机可以接收所有可能出现在XML文档中的片断,也就是说,它可以匹配任何可能出现在XML文档中的路径模式;而传统的自动机要想支持包含连接这一类非正则运算符是非常困难的.为了进一步提高模式自动机的性能,该文还提出了两种优化方法PSA和RWS.前者将模式自动机作为索引的一部分存储在磁盘上,避免了每次计算都要生成模式自动机的开销,后者则是通过following集合和preceding集合来过滤掉模式自动机中多余的状态和转换函数来达到提高查询效率的目的.为了支持自动机匹配算法,该文还提出了高效地支持自动机匹配算法的数据结构:路径模式树和路径实例树.通过与结构连接算法进行性能测试对比,我们发现自动机匹配算法的效率远远高于结构连接算法,PSA和RWS对自动机匹配算法的优化也很显著.与传统的关系数据库中的查询不同,针对半结构化数据的查询更多的是要找到满足某些特定模式的节点.近来,在简单路径查询的问题得到较好解决的基础上,人们将注意力转移到Twig查询中来.该文提出了如何利用索引技术来更好地解决Twig查询的问题.根据路径模式树索引,我们给出了利用自动机匹配路径模式树索引解决这一问题的方法,围绕这一方法,该文对Twig查询自动机的构建,Twig查询自动机与路径模式树的匹配等算法进行了讨论,并与用传统的结构连接方法解决Twig查询进行了实验对比,结果证明,基于自动机的方法在性能上具有较大优势.
其他文献
数据挖掘(Data Mining)是涉及数据库、人工智能、统计学等学科的一门活跃的研究领域,是从数据库中识别出有效的、新颖的、潜在有用的和最终可理解的知识,并对商务决策做出重要
嵌入式系统融合了计算机软/硬件技术、通信技术和半导体微电子技术,根据应用要求,把相应的计算机直接嵌入到应用系统中.该文将详细介绍ARM7TDMI处理器的JTAG调试接口设计过程
随着计算机网络技术的发展,计算机支持的协同学习(Computer-SupportedCollaborativeLearning,简称CSC)已成为当前计算机科学的一个十分活跃的研究领域。它突破了传统教学中时间
地震事业的发展经历了几个时期,从模拟到数字,从监测预报到快速的应急反应等.目前防震减灾应急系统已经成为地震部门的重要工作.因此,在地震发生以后,如何在第一时间得到地震
自1970年代子带编码用于语音压缩以来,人们对其在图象和视频压缩中的应用进行了大量的研究.小波理论对子带滤波器的结构作了本质的分析,从而产生了很多有价值的滤波器设计方
随着Inernet技术的飞速发展,人们对数据通信、信息共享的需要日趋膨胀.传统的通信网主要提供话音业务,而今后的通信网将主要以传送数据和多媒体业务为主.基于软交换的下一代
Web服务是一个封装成实体并发布到网络上以供其他程序使用的功能的集合,Web服务运行时,用户无需知道服务的实现机制,只需要知道服务接口即可实现服务调用.随着网络技术的衍生