Spark环境下并行方体计算技术

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:along_1979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着大数据时代的来临,对联机分析处理(OLAP)提出了更高的性能要求。针对传统OLAP处理大数据时实时响应能力差的问题,探讨基于分布式内存计算框架Spark加速立方体计算,设计了基于Spark的内存集群BUC算法BUCPark(BUC on Spark),提高了BUC的并行度和大数据适应能力。在此基础上,基于内存重复利用和共享的思想,避免内存中迭代的立方体单元膨胀,设计了改进的BUCPark算法LBUCPark(Layered BUC on Spark)。实验结果表明LBUCPark算法性能优于BUC算法和BUCPark算法,能够胜任大数据背景下的快速数据立方体计算任务。
其他文献
  Fruits are rich in phenolic compounds and exhibit high antioxidant activity.Recent studies have shown that wounding caused by cutting and some post-cutting
会议
  特征选择旨在降低待处理数据的维度,剔除冗余特征,是机器学习领域的关键问题之一。现有的半监督特征选择方法一般借助图模型提取数据集的聚类结构,但其所提取的聚类结构
  为有效识别与管理机会,依据认知信息加工论,参照认知活动的过程特性,认知情境模型和注意的信息过滤器机制,本文提出了由私有视图获取、私有场景构造、场景融合、场景泛化与场
会议
  随着需要处理数据集的规模越来越大、时效性要求越来越高,对聚类算法的性能和大数据适应能力提出了更高的要求。模糊C均值聚类(FCM)是一种重要的柔性聚类技术,在多个领域
会议
本文在对世界石油资源、北疆原油资源、北疆稠油性质分析及稠油加工形势进行大量调研的基础上,对北疆稠油利用现状、存在问题、克拉玛依石化公司稠油集中加工的优势进行了详
  Presentations during this conference will demonstrate that we are beginning to understand how to control fruit ripening,manipulate fruit quality,and add,mod
  目前我国正在大力推行"一带一路"航海战略,航海事业蓬勃发展,大量新码头正在修建中。如何快速、准确更新码头的空间信息,对于分析进出口贸易、提高码头服务效率等具有很强的
会议
水稻稻曲病是由稻绿核菌引起的水稻穗部病害。近年来,随着高产杂交水稻的大面积种植以及高产栽培技术的推广,水稻稻曲病已由水稻次生病害上升为主要病害。认知稻曲病流行规律,对
  针对支持向量机在分类决策过程中会因为支持向量的暴露而导致隐私信息的泄漏,提出了一种基于信息浓缩的隐私保护分类方法IC-SVM(Information Concentration Support Vecto
会议
本文针对炼油厂延迟焦化装置的焦化炉进行了红外监测,通过测量炉管外壁温度,来判断其内壁结焦情况和炉膛温度场分布规律,及时进行烧焦(除焦)和调整火咀火焰,提高其加热效率,