网络环境下XPath查询集冗余去除的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:abcoabco1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于XML数据具有自描述特点,可以支持用户自定义的标记,符合Internet上数据描述和存储的需求,所以XML正在逐渐成为Internet上数据表示和数据交换的实际标准。随着其规模和复杂性的快速增长,以XML格式表示和存储的数据得到了Internet领域和数据库领域研究人员的重视。Internet上的应用对XML数据的查询、定位和获取的需求不断增加,也引发了对XML数据进行合理存储和快速查询的要求。随着XML成为目前信息交换和表示的标准,XML数据库的应用也变得十分广泛,在所有XML数据库应用中,XML的相关查询占主要地位,尤其网络方面也存在多种XML数据库查询的应用。通常情况下,在XML数据库网络查询模式中客户端向远程XML数据库所在的服务器端提交一个XML查询,服务器端查询后,通过网络返回给客户端查询的结果。网络环境下的XML数据库查询应用,已存在多种优化技术,如查询重写,语义缓存。多种优化技术均是为了加快查询的响应速度或者减少查询的网络流量。不同于现有的工作,本文从一种新的角度对XML数据库网络查询进行优化,使用了一种新的优化技术,来减少网络流量,相关两个或者多个查询之间往往存在冗余,XML的树形机构更是加重了这种冗余的存在,所以在本文中,通过XPath查询集冗余去除一去除用户提交的两个或者多个关联XPath查询集合查询结果内存在的冗余来优化网络流量。本文首先介绍了XML,XPath查询的树模式,XML数据库查询网络应用方面相关概念和知识。接着,对目前XML数据库网络查询模式中存在的几种优化技术:语义缓存,利用物化视图进行查询重写等进行了详细的讲解,并与本文提出的冗余去除技术进行了比较,指出了其相同点和不同点,阐述了本文使用的优化技术的创新之处。文章主体部分给出了自主设计的XPath查询集冗余去除系统的框架,讲解了框架中各个模块的功能,框架的主体部分采用文中的冗余去除算法。XPath查询集冗余去除算法也是本文的主体部分,针对简单和带谓词的两种类型XPath查询集对算法进行了讲述:先通过实例阐述算法,再对相关的结论进行了证明。其中,算法对存在谓词分支的XPath查询集,利用了XPath查询树模式进行改进。系统对原有XPath查询集冗余去除的解决方案提出了改进,引入了查询相关性判断模块和DTD判断模块,后者利用DTD树对查询集在不同XML文档结构下的冗余度进行评估,并在算法中权衡选择网络流量和XPath查询复杂度,使之更能满足用户实际需求。最后,文章通过实验对算法相关的结论进行了验证,通过分析试验结果指出了算法优化和扩展的先进性。本文所做的工作对于当前网络流量仍占相关考核项重要地位的XML数据库网络查询模式应用有着重要意义,尤其是对某些依据网络流量进行计费的网络XML数据库应用。
其他文献
随着互联网和电子商务的快速发展,各种商业活动和人们的日常生活越来越多的依靠网络来进行,如电子现金交易、电子拍卖、电子招标和电子合同的签署等。在复杂的网络环境下,如
在过去的数十年中,无论是商业企业、科研机构或者政府部门,MIS系统(Management Information System,管理信息系统)都被广泛地应用在信息管理上。以事务处理为主的MIS系统在方
XML自出现以来,就以其强大的跨平台交换的能力、数据表达能力以及简单、开放性、可扩展等优点而逐渐成为互联网上信息发布和交换的事实标准。由于XML数据的开放性,特别是网络
随着互联网技术的快速发展,网上信息的迅速增加,人们越来越依赖于搜索引擎来获取互联网上有用的信息。搜索引擎在给用户获取信息带来方便的同时也把用户带入了信息过载的窘境。
膜计算作为自然计算的一个新分支,是受生命细胞的结构和功能以及高级生命组织和器官间的协作所启发的一种计算模型,这种计算模型普遍称为P系统。由于其具有分布式、并行计算
随着互联网的发展,涌现出大量同类网站(例如房产网、吃玩网、旅游网等),由于各个网站间信息的孤立性,人们为获得有效信息不得不游离于各个网站之间。虽然,像谷歌、雅虎、百度
随着机场信息化的不断发展,网络规模不断扩大,网络结构变得越来越复杂和多样化。如果某个网络设备出现故障或运行状态不佳,将会导致运营效率的下降,甚至导致整个机场的瘫痪。传统
由于误报率低并且报警结论明确,滥用检测一直是实践中入侵检测系统(IDS)主要采取的技术。同时,面对现实中越来越多的多阶段入侵,人们的共识是将多阶段入侵视为由多个行为组成、
随着Internet的飞速发展,网上的数据资源空前的丰富。每天都会有成千上万的用户在网络上浏览和寻找自己所需的信息。然而,由于庞大的信息量,对于每个用户来说,如何能够及时快
摄影测量技术(Photogrammetry)是一种通过记录、测量和解读图像信息及其他电磁辐射现象的模式获取物体和环境的可靠信息的科学和技术。该技术在航空遥感分析、3D场景重建、交