CoXML中XML的关系存储和查询的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:a242269752
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,XML得到了广泛的应用,并逐渐成为Internet上数据表现和交换的标准.为了有效支持信息的交换和共享,必须对XML提供强大的存储支持以及在此基础上的高效查询.关系数据库能提供严格结构化的存储并且能提供良好的并发、事务控制以及查询优化等功能,特别是随着电子商务的兴起,很多商业数据都存储在关系数据库中,为了把这些数据和XML进行良好的整合和集成,人们逐渐研究利用关系数据库来存储XML.该论文的工作重点是在CoXML系统中实现XML的关系存储和查询.CoXML是北京大学数据库实验室"基于XML的数据集成、共享与交换"(编号2002AA4Z3440)的863数据库重大专项课题,主要研究基于XML的异构信息集成与共享和XML数据与国产关系数据库数据的模式转换等.该论文的工作将在CoXML系统中实现XML到关系数据库的模式转换和存储,并实现XML查询语言到关系数据库查询语言的转换.首先,XML关系存储引入并实现了inline算法,把逻辑上属于一个整体的节点存储到一张关系表中,避免生成了琐碎的小表,提高了查询速度.但是inline算法并没有体现XML的节点间位置关系如父子、祖孙、前序、后序关系等,该论文在此基础上引入了Pre-Post并改进为扩展Pre-Post编码方式,解决了此问题.算法分三个步骤:首先为DTD生成一个简化的DTD图,其次根据DTD图生成关系表,最后把XML数据存储到关系表中.其次,在XML关系查询中实现了从XPath到SQL的转换,并在DTD的支持下对出现频繁的步骤(step)中Axis为"∥"和node-test为"*"的情况做了优化.算法也分三个步骤:首先实现XPath到SQL语言的转换,其次从关系表中提取数据,最后把数据整合还原为原来的XML文档.试验数据表明,XML关系存储能比较完整存储XML数据,较好的保持XML节点间位置关系信息;XML关系查询能有效的处理XPath查询语言,准确的查询并还原XML数据,并具有较好的查询效率.
其他文献
由于数码相机的最终目的是拍摄图像,因此,数码相机图像质量评价是数码相机领域最重要的课题之一.数码相机基本上都采用图像压缩算法对拍摄的图像进行处理,所以压缩图像的图像
合成孔径雷达(Synthetic Aperture Radar,SAR)技术自20世纪50年代诞生以来在二维/三维高分辨率成像、多维度成像、多模式成像、动目标检测等多个方面取得了显著的发展。近年来
随着国民经济的持续增长,信息交流的日益增多,通信业务已从单一话音业务逐步过渡到话音、数据、多媒体宽带综合业务。近年来,在全球范围内都采用DWDM系统以扩大现有光纤通信系统
知觉学习和面孔识别是目前非常活跃的研究领域。在认知神经科学研究中,知觉学习的核心问题是脑的可塑性和特异性,而面孔识别则是围绕特异化面孔加工脑区的存在以及脑区间的关系
干旱胁迫已成为世界性问题,其对作物的危害超过其他逆境危害的总和,因此研究植物耐旱分子机制成为植物基因工程研究的重点。渗调蛋白(Osmotin)是植物细胞膜的组成蛋白,有研究表
高光谱遥感技术能够探测到宽波段遥感中无法探知的地表成分细节信息,但由于空间分辨率的限制和地物的复杂多样性,混合像元问题非常突出,成为高光谱定量化应用研究必须解决的关键
导航信号是卫星导航系统的重要组成部分之一,直接影响着导航系统定位、导航、授时的可靠性和精确度。随着全球卫星系统的发展和用户需求的增加,导航系统需要更多类型的服务。
光学活性D-氨基酸常作为一种中间体被广泛应用于半合成抗生素、多肽激素、拟除虫菊脂、杀虫剂等的合成。目前,工业范围的D-氨基酸生产大都采用酶法转化,首先是在D-海因酶的作用
随着时代的发展和国家需求的提高,微波技术发展越来越成熟,遥感观测中场景的三维信息也变得日益重要。传统意义上的SAR通过斜距向的大带宽信号以及方位向的合成孔径,具备了二维
随着语音信号处理研究逐步走向实用化,声音分类,尤其是面向特定领域的声音分类研究越来越受到重视.它的目的是在声音流中识别出不同的声音类(如语音、音乐等),并将属于相同声