论文部分内容阅读
对数据仓库多维视图进行容量估计是数据立方体设计、数据仓库存储规划和实施查询优化的基础.首先以统计理论为基础,提出了一种基于采样的数据仓库数据立方体空间估计策略.该策略针对不同类型的多维视图,对样本统计结果采用不同的空间放大策略,确保了估计结果具有较高的准确性.同时,该策略在最大估计的基础上采用一些启发式规则,对估计视图集进行有效的约简,并在估计过程中采用了样本视图预物化思想,根据预物化视图集生成优化的立方体空间估计序列,从而大幅缩短了整体估计时间.