XML索引及查询处理技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：yangyuxxxx

【摘要】

：

XML是互联网联合组织(W3C)创建一组规范,以便于软件开发人员和内容创作者自由地组织信息,其目的不仅在于满足不断增长的网络应用需求,同时还希望借此能够确保在通过网络进行

【作者】

：

王洪强

【出处】

：

哈尔滨工业大学

【发表日期】

：

2009年期

【关键词】

：

XML 索引查询处理聚合绝对路径聚合链路径素数序列

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

XML是互联网联合组织(W3C)创建一组规范,以便于软件开发人员和内容创作者自由地组织信息,其目的不仅在于满足不断增长的网络应用需求,同时还希望借此能够确保在通过网络进行交互合作时,具有良好的可靠性与互操作性。良好的数据存储格式、可扩展性、高度结构化、便于网络传输是XML主要的四大特点,决定了其卓越的性能表现。目前,面向XML数据的存储和查询已经有大量的技术提出,但是这些技术并不能够满足高效XML数据处理的需要,较成熟XML处理技术对系统资源要求高或采用基于关系数据库的存储方案,其处理方式多为无索引支持,对数据规模较大或数据结构复杂的XML数据处理性能较差。本文以高效处理XPath查询为目标,研究了多种适合XML文档树的节点标记法,并将节点集组织成相应的索引结构,以及提出了高效的算法用于在索引上处理XPath查询,本文主要研究成果如下:(1)基于聚合绝对路径标记法的索引结构及查询处理算法。聚合绝对路径是以XML标准的父-子元素位置信息为基础的,因此该标记法直接支持XML查询的Position谓词。聚合绝对路径标记法把具有相似位置信息的节点集聚合为索引中的一个节点,有效提高了查询处理的速度。基于聚合绝对路径标记法组织的索引结构,我们提出了分枝过滤算法和关联路径匹配算法用于高效的处理查询,实验表明以上两种算法优于TwigStack算法并有良好的延展性。(2)基于链路径树标记法的索引结构及查询处理算法。将文档中的节点按照源路径同构划分为多个子树,每个子树的各层节点集均为同构节点集。全部子树的叶节点集为文档空间节点集的一个划分,按叶节点集创建的索引结构将等同与1-Index索引结构。由于子树特征被记录,基于链路径树标记法的索引结构将可以快速的得到节点集的祖先集并可以高效处理带有分枝的查询。基于链路径树标记法的索引结构,我们提出了关联路径连接算法来高效的完成查询处理,实验表明关键点连接算法优于TwigStack算法并有良好的延展性。(3)基于源路径树标记法的索引结构及查询处理算法。我们通过节点标记的区间来取代单独的节点标记,并改进索引的存储机制使得算法的输入输出最小化,改进的查询处理算法对匹配各分枝的链路径分组,有相同关联路径的可以连接,否则抛弃。实验表明,改进的标记法具有较小的存储空间,较小的输入输出代价以及更快的执行效率。(4)基于素数序列标记法的F&B索引的创建算法以及查询处理算法。提出使用素数或素数的乘积的序列来标识一个节点的方法,如果两个节点的标记值相同,那么这两个节点就一定是F&B同构的。这种标记法不仅有助于快速的建立F&B索引,更可以高效的完成F&B索引上的查询处理。此外,我们还给出了F&B索引上的区间标记法与CCPI的创建过程,该两种编码创建过程无须在建立F&B索引后二次创建,仅需与F&B索引创建过程一起对文档使用SAX解析器分析一次即可得到。这样,我们可以在F&B索引的区间标记法上使用TwigStack算法执行查询处理,在F&B索引的CCPI标记法上使用关联路径连接算法执行查询处理。我们还给出了基于素数序列标记法的查询处理算法,即素数整除匹配算法,该算法可以高效的判定某节点是否有某分枝子结构。实验表明素数整除匹配算法优于F&B索引上的TwigStack算法以及CCPI并有很好的延展性。

其他文献

“找规律”教学设计及反思

1．通过物品的有序排列，使学生初步认识简单的排列规律，会根据规律指出下一个物体。

期刊

教学设计应用规律会场布置总结规律

国内外机械制图课程调研比较与思考

摘要：本文介绍了美国加州大学洛杉矶分校（UCLA）的选课制度、课程体系与助教制度等，并将国内外两所大学（UCLA与天津大学）开设的机械制图课程作以比较，提出研究受教育者的学习行为是进行机械制图课程教学改革的前提。　　关键词：机械制图；选课制度；课程体系；助教制度　　中图分类号：G642.0 文献标志码：A 文章编号：1674-9324（2017）34-0102-02　　一、概述　　在国家留学基金和

期刊

机械制图选课制度课程体系助教制度mechanical draftingelective systemcurriculum systemteaching

智慧农家乐体系构建——以河北天桂山景区柏树庄智慧农家乐建设为例

乡村旅游已成为现代绿色健康旅游业的一条可持续发展道路。农家乐的旅游方式受到广大旅游爱好者的青睐。然而,传统的以口碑效应为传播方式的旅游模式已经无法实现游客的预期

期刊

智慧旅游农家乐体系

基于小波的岩石节理裂隙图像处理

岩石节理裂隙在岩石工程中具有重要作用。例如当放射性物质掩埋后,岩石节理就成为放射性物质泄漏的主要途径;在其它如工程爆破、隧道挖掘等岩石工程中,检测岩石节理裂隙也是

学位

岩石节理裂隙边缘检测小波分析四元数图像融合运动模糊

美国农地管理主体与管理制度的历史变迁及对我们的借鉴

通过对美国农地管理制度演进阶段和管理主体以及主要机构的分析，指出美国的农地管理制度是在变迁的过程中不断完善的。其基于产权明晰基础上的衣地管理制度、有针对性的衣地管

期刊

美国农地管理主体与管理制度历史变迁借鉴

强精煎治疗精液异常临床举隅

强精煎系笔者自拟的处方。常用于因少精子、死精子、无精子、畸形精子、精液不液化所致的不育症以及阳萎、不射精等性功能障碍。取得了效好的效果。本方由炒蜂房15克淫羊藿15

期刊

强精煎精液异常精液常规检查精子计数临床举隅

突发公共安全事件与应急管理对策

期刊

应急预案应急处置突发公共事件综合灾害风险管理突发公共安全事件公共安全管理突发公共卫生事件事故灾难管理对策

基于细胞因子的生物网络协同进化理论与应用研究

随着网络应用需求日益朝着高性能、大规模、多样性的方向发展,对Internet网络提出了更高的分布式要求。对网络系统逐渐提出自扩充性、可移动性、可生存性、简单易操作性的要

学位

神经内分泌免疫网络生物网络细胞因子网络协同进化双信号模型分布式入侵检测系统Web服务协同感知

吃茶去来碑

照片上这块“吃茶去来碑”是１９９９年７月１５日建在韩国釜山海印寺范围内的最高处。关于“吃茶去”的禅案，凡是好茶的都知道就不必再说。１９８９年９月９日，赵朴初先生写了一首诗：七碗受至味，一壶得

期刊

海印寺

XML索引及查询处理技术研究

其他学术论文