论文部分内容阅读
近年来,在诸多行业数据大量以流数据的形式出现,例如电信公司关于通话记录的数据。这些数据充分表现着流数据的两个典型特征:1.数据以流的形式到来而非静态的存储;2.数据到来的速度很快。以AT&T公司为例,他们每天收集到100Gb的数据,也就是说,每秒有多于1M的数据到来。这种数据量和速度对流数据管理系统设置了很大的挑战。本文采取分划渐进策略提出“分阶回归”作为多项式回归的一种替代算法来进行趋势分析,还证明了用分阶回归替代多项式回归的合理性。