论文部分内容阅读
目前,信息处理技术的应用领域得到了很大的拓展,如:网络、金融、电子商务、传感器网络等。在这些应用中,数据不再拘泥于静态的关系数据,而是一种连续、无界、实时传输、不定速度的流式数据,即数据流。传统数据处理技术突显出自身的局限性,数据流查询处理技术成为数据库研究领域的又一热点。 查询优化是查询处理中的关键技术。数据流中查询多为连续查询,查询一经注册,该查询一直执行,除非人为加以制止。在一个查询执行期间,随着时间的推移,系统的运行环境将不断地发生变化,数据流本身的一些特征也在不断地发生改变。为提高查询效率,改善系统性能,系统需不断适应易变因素,对查询进行动态调整。因此针对系统环境和数据流本身特征的易变性,查询优化以及优化所涉及到的迁移技术应运而生,并成为数据流查询处理中关键技术之一。 针对数据流中流数据本身及执行环境的易变性与连续查询的特点,首先提出了一个崭新的基于输出速率的代价模型——MaxRateModel;然后在此代价模型的基础上提出了查询优化策略,以动态选择具有最大输出速率的查询计划;并通过实验验证了所提出的代价模型的正确性,以及查询优化策略的可行性。 在数据流的连续查询过程中,查询优化策略需动态地对操作符序列进行重排列,这就涉及到新旧查询计划的迁移。在对传统的Moving State迁移策略进行深入研究地基础上,提出了Pmoving(Parallel Moving)迁移策略。实验证明Pmoving迁移策略可使动态的查询计划进行平滑过渡,避免迁移过程中出现无元组输出的空白期,尤其是在系统资源紧张和数据流流速过大时,仍能确保较少中间元组和较大的输出速率。