论文部分内容阅读
现有数据方(Cube)物化选择算法中,一般采用查询频率分布和物化成本模型来指导物化选择,忽视了查询结果最终是为系统决策支持使用。实际系统中,Cube查询结果的子集就可以满足决策支持需要,这使得查询结果集的部分决策冗余;据此,将完全Cube约简为D-Cube。本文提出面向决策支持的物化Cube选择方案,将系统决策支持需求分解为查询序列集,定义查询的决策贡献度;根据查询决策贡献度、物化成本和查询频率来选择物化Cube。通过理论分析和实验结果表明:该方案在海量数据仓库及数据流Cube中优于其他选择方案。