论文部分内容阅读
随着信息处理在通信、工业生产、商务处理等领域的广泛应用,数据已不仅仅拘泥于文件、数据库等传统的静态形式,一种连续、无界、不定速度的数据流已经出现在越来越多的应用领域,如:网络监控,传感器的数据处理,生产线管理,股市信息分析等。特别是在数字化、智能化的嵌入式系统中,需要对实时数据进行复杂、高效的分析和处理。对流式数据的管理是这些应用领域的核心问题,由此兴起的支持高性能嵌入式计算的流式数据管理技术正在成为数据库领域新的研究课题。
为了更有效的查询和管理数据流,更好的设计实现数据流系统,我们先从数据流模型入手,对现实世界中数据流的特征进行提取和抽象,以在语义和技术上对数据流上的操作进行规范和指导。本文提出了一个具有一般性的、可扩展且可定制的数据流模型RSModel。该模型突出刻画了数据流的时间特性,对数据流上的操作语义进行了深入的分析和定义,并把数据流的数据特性和操作特性以约束的形式抽象出来。RSModel以三元组形式化的描述了数据流的数据结构,数据操作以及约束。此外,RSModel将静态关系和数据流在数据形式和操作上进行了统一。
数据流的查询语言作为用户与数据流管理系统之间进行语义交换的桥梁,从很大程度上体现出了数据流处理的特点。在RealStream原型系统的实现过程中,我们以RSModel作为理论依据,定义了一种支持多目标的数据流查询语言RSQuery。它可以同时完成对数据流和关系表的操作。此外针对数据流的特性,语言中还引入了时间戳,时间粒度,连续查询,近似查询等相关概念,并以丰富灵活的语法支持了数据流上的查询操作和约束控制。
最后,对数据流模型的具体实现,即数据流管理系统的设计实现进行了介绍。