论文部分内容阅读
随着大数据时代的来临,对联机分析处理(OLAP)提出了更高的性能要求。针对传统OLAP处理大数据时实时响应能力差的问题,探讨基于分布式内存计算框架Spark加速立方体计算,设计了基于Spark的内存集群BUC算法BUCPark(BUC on Spark),提高了BUC的并行度和大数据适应能力。在此基础上,基于内存重复利用和共享的思想,避免内存中迭代的立方体单元膨胀,设计了改进的BUCPark算法LBUCPark(Layered BUC on Spark)。实验结果表明LBUCPark算法性能优于BUC算法和BUCPark算法,能够胜任大数据背景下的快速数据立方体计算任务。