XML数据的编码方案与结构连接算法研究

被引量 : 0次 | 上传用户:zhengjjing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML,又称可扩展标记语言,已经实质上成为了Internet上的数据传输标准。由于使用的越来越广泛,如何对这些数据进行有效的存储、查询,已成为当今学术界研究的一个热门课题。而结构连接方法无疑是XML数据查询的核心操作。为了有效的支持结构查询,目前已经提出了XML数据的各种编码方案。全局区间编码方案能够很好的支持结点结构关系的判断,因而在结构连接中被普遍使用。虽然如此,但采用全局区间编码方案的XML文档的更新效率却很差,需要对整个文档进行重新编码。相对的,采用局部区间编码可以很好的解决文档的更新问题,但它不能直接支持对结点的结构关系的判断,无法被结构连接算法所采用。作为两者的结合,前缀编码既能支持结构连接,又有较好的文档更新效率,是一种有前途的编码方案。为了进一步提高文档更新效率,对经典的前缀编码Dewey编码进行了改进,得出了扩展的Dewey编码Ext-Dewey。采用Ext-Dewey编码的XML文档树在进行更新操作时,完全不需要对树中其它结点进行重新编码,效率很高。更进一步,设计了基于Ext-Dewey编码的结构连接算法,并且在匹配父-子关系的算法中,不使用经典算法中常用的栈来保存中间结果,减少了空间开销。针对区间编码,实现了一种优化算法,其不需要使用任何索引结构,就能在某些情况下避免不必要的连接操作,提高算法效率。最后,将此优化策略用于基于Ext-Dewey编码的连接算法上。实验数据表明,基于Ext-Dewey编码的连接算法是正确的,并且优化后的算法较未优化前性能有普遍的提高。
其他文献
目的观察益气滋阴中药芪药消渴胶囊对高脂饮食诱导追赶生长大鼠肝脏及骨骼肌糖脂代谢的影响。方法采用限食及开放高脂膳食法复制追赶生长大鼠模型,用不同剂量的芪药消渴胶囊[
<正>近年来,保健食品、医疗、药品广告日益成为虚假广告"重灾区"。虽大力整治,但医药广告违法率仍居高不下,顶风违法,明目张胆地挑战法律的问题十分突出。据国家食品药品监管
本文采用文献资料法和综合分析法,分析了弹跳力对篮球运动员的重要作用,并对中学生篮球运动员的弹跳力的训练方法进行了测试和分析,并提出了自己的见解。
校园快递超市是近两年发展起来的一种新的快递模式。以中国地质大学江城学院快递超市为例,对这种模式在运营过程中产生的问题进行了分析,提出了采用作业成本法核算快递超市运
为了提高虾青素产品的纯度和得率,研究了KOH-C2H5OH将不同的虾青素酯皂化成游离虾青素的皂化工艺,如碱的种类、助溶剂、碱浓度、皂化时间和温度对皂化的影响。以碱浓度、反应
<正>英语,作为一门国际语言,越来越受到重视。作为启蒙教育的奠基石,幼儿英语教育成为关注的"热点"。随着社会经济的发展,人们越来越注重双语教学教育的开发研究,幼儿园双语
<正>投资者进行短线操作能在市场大涨大跌之时灵活进出,但也要求投资者技术过硬、遵守纪律。股市是个大舞台,包罗各种股市舞蹈家,有跳芭蕾的,也有跳拉丁的;同样股市江湖中,武
负债经营是企业通过负债提高经济效益的一种经营方式。适当的负债经营可使权益资金和债务资金所有者都获得益处,实现双赢,其产生双赢的机制在于提高债务资金利润率。举债融资
<正>"花园洋房"作为20世纪前期上海城市具有特色的住宅建筑,反映出殖民时代上海时尚生活方式和超前消费理念,折射出的个性化审美情趣和精神气质,昭示那个时代的城市消费文化