【摘 要】
:
随着计算机网络和通信技术的发展,数据流(Data Stream)的相关研究受到广泛关注,在诸如金融分析、传感器网络、交通信息系统、移动对象跟踪、网络数据监控等领域已有数据流管理系
论文部分内容阅读
随着计算机网络和通信技术的发展,数据流(Data Stream)的相关研究受到广泛关注,在诸如金融分析、传感器网络、交通信息系统、移动对象跟踪、网络数据监控等领域已有数据流管理系统(DSMS)的实际应用。另一方面,XML数据格式因为其固有的优点以及现实应用对于高效网络通信的需求已经成为网络数据交换的标准,数据流开始以XML格式表达,例如在Web Services环境下,松散结合的系统之间相互交换大量以XML格式表现的商务数据,产生持续的XML数据流。因此,XML数据流上的相关理论和技术目前已经成为数据流研究领域中的一个热点。
XML数据流高速的产生和传输,具有有序性、实时性、不确定性、单遍扫描等特点,如何高效的处理这些流数据,对其进行过滤、解析和查询是当前XML数据流研究的关键问题,目前提出的算法主要有基于自动机的算法、基于索引的方法等。DTD的结构信息对于XML查询效率的提高有很大的帮助,而现有的大部分算法没有利用DTD这一有效资源。本文针对XML数据流上查询的关键技术展开研究,研究内容围绕数据流的查询处理流程,分为两个部分:XML文档流的过滤、XML数据流上的查询处理,涉及的技术及理论包括DTD、函数依赖、自动机技术、索引技术等。
本文所做的主要工作是:
1.提出了基于数据流的XML文档过滤模型及过滤匹配算法。研究了自动机理论在XML数据处理中的应用,通过扩展DTD及树自动机的定义,将完整性约束及函数依赖引入查询处理,能够实现在一遍扫描的条件下,完成文档流的过滤匹配。
2.提出了XML数据流上的查询处理模型及查询算法。设计了一种适用于XML数据流查询处理的索引结构DBXSI,在索引结构中引入DTD的结构信息,在DTD和流索引的基础上实现了XML数据流查询算法。通过XPath树自动机和DTD树匹配,预先标识与查询结构不匹配的DTD结点,在执行查询时,根据流索引DBXSI信息直接跳过某些与查询不匹配的子树及结点,提高查询效率。
其他文献
在对图像的研究和应用中,人们通常只对图像中的某些部分感兴趣,图像分割就是把图像分成各具特点的区域并且提取出感兴趣的目标的技术和过程,这些特点可以是灰度、颜色、纹理
随着世界经济一体化的进展,各国之间互联网交流更为广泛、频繁,互联网信息的多语种特点,给交流带来的语言障碍日显突出。为解决语言障碍问题,跨语言信息检索技术应运而生。目
生物质能作为一种新型的能源,具有传统能源无可比拟的优势,它清洁、高效、可再生。秸秆作为生物质燃料的代表性一员,在作为农业大国的我国大量存在,直没有得到有效地利用,被随意处置,甚至就地焚烧,既造成了资源的极大浪费,也对环境构成了巨大危害。本文首先介绍了所用到的相关知识,即供应链管理理论和博弈论知识。通过生物质燃料发电这一切入点,把涉及到的三方即农户、电厂、政府作为课题的研究对象,采用博弈论的知识,借
当今,随着科学技术的不断深入发展,不同学科之间的交叉和技术渗透成为科研人员研究的热点,因为对于客观世界中的某些具有挑战性的问题只凭借单一的技术是很难解决的,往往需要
20世纪80年代以来,随着计算机、通讯技术的迅速发展,以及各种数字化、体积小、重量轻、探测精度高的新型传感器的不断面世,无人机(Unmanned Aerial Vehicle,简称UAV)的性能有
近年来,数据库技术得到了突飞猛进的发展,特别是关系数据库的应用,导致了海量的数据、有限的信息应用问题,引起了广大学者的重视,数据挖掘技术从上世纪九十年代应运而生,被用
随着互联网的广泛应用以及各种办公系统的无纸化,各种电子形式的文本文档正以指数级的速度迅速增长,如何从这些海量的文本文档中快速有效的找到有用的信息,成为信息检索领域的重
果蝇优化算法(Fruit Fly Optimization Algorithm, FOA)是一种对果蝇在觅食过程中的行为进行仿真模拟从而总结得出的一种优化算法。FOA算法根据果蝇所在位置计算其相应的味道
语义网这个概念于2000年首次由Berners-Lee提出,以往Web技术中计算机主要扮演展现信息的角色,几乎不参与信息处理,忽略计算机信息处理的作用,一方面使得Web中庞大数据无法得
交互式遗传算法是一种通过人的主观评价得到个体适应度值的遗传算法。它将人的智能评价与进化计算有机的结合起来,突破了建立被优化系统的显式性能指标的限制,大大扩充了进化