云平台上基于OLAP的what-if分析技术研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:cao678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于商业环境的瞬息万变,决策者需要更快更准的捕获商机。从存有大量历史数据的数据仓库中挖掘有价值的信息,对企业的运营及策略调整起着至关重要的作用。OLAP是决策支持的重要方法,在OLAP系统中,What-if分析是基于历史数据对假设场景进行分析的一类OLAP技术,它在决策者对多种方案进行预测和评估中扮演重要角色。基于Delta表存储是实现what-if分析的通用解决方案,其面临的主要难题是如何快速实现what-if更新和高效地执行OLAP查询。随着大规模并行处理数据仓库的发展,可提供高效的并行查询处理及强大的数据分析能力;同时,云计算具有高扩展性、计算能力强、资源整合、高容错性、处理海量数据以及低成本等特点。本文利用大规模并行数据处理和云计算的优势解决基于delta表存储的what-if分析的性能问题具有重要的意义。本文的主要工作包括:(1)设计与实现基于delta表的what-if分析云服务。首先,采用Proxmox VE构建轻量级云平台、大规模并行处理数据仓库Greenplum存储数据,为what-if分析提供环境支撑;其次,提供基于Mondrian的what-if分析引擎;最后,实现基于Docker的what-if分析云服务。(2)设计两种方案对基于分布式计算的what-if分析并行处理进行性能测试,然后针对OLAP查询中耗时较长的分布式聚集函数,提出并行执行策略;(3)分析基于delta表的what-if分析查询性能瓶颈,并在what-if更新阶段,提出基于bloom filter优化算法,实验结果表明bloom filter算法生成what-if视图比传统的表连接算法性能提高约32%;在OLAP查询阶段,设计并实现基于Redis的查询缓存算法WFQC,与传统的物化视图机制相比,基于Redis查询缓存的OLAP查询性能提升2倍。
其他文献
随着多媒体技术、计算机技术的迅速发展,多媒体数据已经成为重要的信息资源,人们每天都可以通过互联网接触到大量的多媒体信息,如视频、图像、各类新闻等。网络新闻作为一种
海量科学数据的到来使领域科学家面临前所未有的科学数据管理困境。一方面,传统以表为数据模型的关系型数据库管理系统已经不能满足科学领域大规模科学数据的管理需求;另一方
随着通信技术的飞速发展,当今网络正在向着可以提供包括海量数据传输、音视频等各种高带宽服务的下一代网络发展。这种发展趋势对整体网络设施的网络包的处理能力与处理速度
传统的机器学习、数据挖掘算法是基于向量型数据提出的。由于结构化数据在现实应用中广泛存在,图形数据的表示和分析正得到越来越广泛的关注。由于图数据结构的复杂性,不能仅
随着应用层组播技术的不断进步和网络服务质量的不断提高,差错恢复显得越来越重要,因此,提出一种高效的应用层组播差错恢复模型显得越来越迫切。   本文首先对传统的非应用层
随着科技的发展,多媒体数据库里的图像信息越来越多,并且增长速度越来越快,它在提供大量资料的同时给我们带来了烦恼:如何对如此大的数据库进行整理与分类便于用户进行检索。
21世纪是计算机网络高速发展的世纪,但与之同时,黑客入侵日益猖獗,计算机病毒越来越泛滥,这严重影响了计算机网络的正常运行。更为严重的是,网络战争也已经出现在了我们的面
随着互联网信息的快速增长,如何对海量文本信息进行有效聚类一直是文本挖掘领域的研究热点。传统的文本聚类算法通常采用向量空间模型(VSM)进行文本聚类,但是文本向量空间存
伴随着测序技术的发展,许多生物的全基因组序列已经得到,所以摆在生物信息学家面前的问题是如何理解基因组中所蕴含的生物学机制。蕴藏着大量的控制生命活动的遗传信息的生物
针对目前国内学生成绩分析这一部分,仅仅有庞大的数据库,却没有深层次分析导致学生成绩差异的因素,本文设计并完成了学生成绩分析系统。本文针对决策树中的ID3算法的计算过于