XML路径表达式优化及其查询和过滤计算方法

来源 :中国科学院研究生院(计算技术研究所) | 被引量 : 5次 | 上传用户:wdkkiller
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML是一种自描述,可扩展的标记语言,广泛地用于Web环境下数据的表示和共享。要搭建各种基于XML的应用,必须提供处理XML数据的核心技术和工具来高效地生成,查询,过滤,变换XML数据。由于XML有类似树状的结构,所以类似于文件路径那样的路径表达式是XML数据查询和过滤的基础。本文首先研究了用有限自动机来表示XML和XML Schema以及它们之间的关系,然后给出了XML路径表达式的一个代数运算模型,在这个代数模型基础上研究了XML查询语言和过滤语言的核心子语言—路径表达式,它的定义,语法和语义;然后利用有限自动机给出了一个路径表达式的简化方法,最后是它的查询和过滤的有效计算方法,大体上包含以下内容:1)研究了XML的数据模型,它的路径查询语言以及相关的语法和语义它们是有效计算XML查询和过滤的基础。2)以有限自动机为工具,给出了XML,XML Schema,路径表达式的自动机表示形式,以及它们之间的关系。3)研究了在给定XML Schema的情况下路径表达式的简化算法,以及相关的路径表达式的性质,在这个过程中使用了有限自动机方法。正则路径表达式经过这个简化过程以后才能方便,高效地使用SQL/DOM来回答XML查询;把等价的简单正则路径表达式聚成一个等价类可以减少它的计算成本。4)利用关系数据库的存储和查询处理能力来回答XML查询。关系数据库是目前最成熟的数据管理技术,它有优越的可靠性,可扩展性和性能,利用关系数据库来存储和查询XML数据是有效的方法之一。文章给出了一般性的原理和过程,并用一个实验室系统-中国数字图书馆系统工程验证它的有效性和性能。5) XML作为一种数据交换标准,常常用于信息系统之间的数据共享,本文给出了一个简单的方法,在给定XML Schema和关系Database Schema的情况下,如何建立它们之间的对应关系,并给出了一个根据XML查询从关系数据库构造XML文件的方法。6) XML过滤是XML数据处理的另外一个重要的方面,大量的路径过滤表达式经过简化以后转化成一个有限自动机表示,这个有限自动机表示能很好的处理带分支的路径。XML经过SAX分析以后产生一系列的SAX事件驱动有限自动机的执行,试验显示了这个方法的效果。目前在国内,国际上有大量的工作研究XML数据管理技术、XML过滤技术和XML数据模型、查询语言方面的理论。在了解相关工作的基础上,本文主要在以下方面有所创新:1)研究了XML的数据模型,给出了它的路径查询语言以及相关的语法、语义,提出了一种表达能力更强的自动机表示模型,作为有效实现XML查询和过滤的基础。2)提出了基于XML Schema的路径表达式的优化算法。该算法能够在保持语义
其他文献
2014年,国家审计署对中国远洋运输(集团)总公司2013年度财务收支情况进行了审计。此次审计既是国家审计署代表国家对我公司财务收支进行的审计监督,又是对我公司经营管理的全面诊
报纸
目的:观察脑梗死患者近期预后与白细胞数、血糖值的关系。方法:将376例经CT证实的急性脑梗死患者。据入院时按白细胞计数的不同、空腹血糖值,以及糖尿病病史等分组,并对其入院
拥有250多万平方公里国土的苏丹,是非洲面积最大的国家。这个遥远的非洲国家拥有很多妙趣横生的习俗,最令人开眼界的是苏丹人的婚俗趣事!
可重构计算是一种新型的时空域计算模式,它利用了可重构逻辑器件的可重构特性,同时具有类似处理器的以在线编程方式实现各种应用的灵活性和类似专用集成电路的以硬件方式执行计
CAD/CAM是先进制造技术的重要组成部分,数控加工是CAD/CAM技术中最能明显发挥经济效益的环节之一。论文以工程应用为背景,以提高制造质量和效率为目标,深入研究了CAD/CAM系统中
近年来,范例推理(Case-Based Reasoning,CBR)的基础研究及系统实现正受到人们的普遍关注,是当今人工智能研究的前沿课题。CBR不仅是关于人类认知的心理学理论,而且将成为智能计算
一以前人们收听天气预报,获得的气温、风力、阴晴雨雾等是当时惟一的定量生活指数.但是,这些信息,远远不能全面反映天气状况对人体的影响.例如:大多数人都有这种体验,冬季在
在现代社会中,随着科技和经济的飞速发展,人们对身份识别技术的重视程度也进一步提高。传统的身份识别技术,如:密码等,由于防伪性比较差,已经不能适应现代社会对身份识别的要求。为