论文部分内容阅读
提出了一种新的稀疏数据立方计算方法CFD(Computation by Functional Dependencies),它采用自底向上的顺序划分数据立方的各个维,同时按自顶向下的顺序计算聚集,从而充分利用了数据立方的各个group-by之间的共性.CFD和以前所有的立方计算方法不同:一是既能避免计算冰山数据立方中不满足最小支持度的group-by,同时也利用了聚集函数的特征来加速聚集计算;二是利用维之间的依赖关系能有效减少划分时间.实验表明,和以前的算法相比CFD的性能明显提高.