论文部分内容阅读
随着计算机应用的飞速发展,数据流的查询处理逐渐成为当前数据库领域新的研究热点。在数据流的查询处理中,查询操作算法对于查询处理的性能有着很大影响,本文致力于数据流查询操作算法的研究。 数据流上的查询主要是连续查询。连续查询处理的执行方式有两类:一类是立即执行方式;一类是周期执行方式。目前,基于滑动窗口的查询操作算法都是适用于立即执行的连续查询。但是在实际应用中,有时需要周期执行的连续查询。 本文提出了适用于周期执行的连续查询的滑动窗口查询操作算法,即滑动窗口是以基本窗口为单位周期更新的复合滑动窗口查询操作算法。本文研究的内容主要包括复合滑动窗口的连接操作算法、复合滑动窗口的聚集操作算法和复合滑动窗口的连接聚集操作算法。 本文提出的复合滑动窗口的连接算法是一种基于流水线的对称连接算法。我们考虑了复合滑动窗口中的基本窗口结构对连接算法的影响,给出了不同的实现算法。本文提出了复合滑动窗口的简单聚集算法和分组聚集算法。对于简单聚集算法我们通过利用第N次的聚集值来计算第N+1次的聚集值,提高了查询的效率。对于分组聚集算法还考虑了复合滑动窗口中的基本窗口结构对分组聚集算法的影响,给出了多个的实现算法。本文提出的复合滑动窗口的连接聚集算法在处理连接的同时计算聚集值,不再保存复合滑动窗口的连接结果,从而有效的节省了查询操作的内存开销。理论分析和试验结果证明了本文提出的算法具有良好的时间和空间复杂性。