数据仓库中物化视图选择算法的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:jxncjwt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
原有的物化视图选择算法大多数都假设查询是均匀分布的,而在实际应用中,这个假设一般是不成立的.本文在查询分布不均匀和总的存储空间一定的情况下,提出一个物化视图选择的解决方案.该方案分两个步骤:第一步,收集对数据仓库系统的常用查询及其查询概率,并提出一个物化视图的静态选择算法.第二步,在系统的运行过程中,记录实际的查询及其频率,在此基础上,对静态选择产生的视图进行简单的调整,以适用实际的情况,提高系统的查询效率.静态选择算法是本文的主要贡献,文中从n维星型模型引导出一个含有2个结点的视图偏序图,以前的算法对偏序图上所有的结点都计算其大小(行数),计算量相当大.为此,本文提出一个候选视图的选择算法,将不可能被物化的视图首先排除,大大降低了在选择过程中的计算量.视图的代价模型有很多,本文选择一种改进的线性模型,该模型突出了视图的查询概率.在候选视图和改进的线性代价模型的基础上,提出物化视图的静态选择算法及其伪码表示,并给出了算法的分析与验证,分析指出通过该算法选出的视图很好的体现了对数据仓库的实际需求,试验表明静态选择算法可以大大降低物化视图选择过程的时间.动态调整方案是在分析了静态选择算法的适用范围的基础上提出的.在数据仓库的运行中,事先预测的常用查询与实际的查询需求往往有一定的差距.系统运行中记录各个实际查询及其频率,当频率在一定时间内达到相当的值时,该查询所对应的视图应该被物化,并在已经物化的视图中选择近期查询频率低、收益少的视图删除,以提供足够的空间来存储将要被物化的视图.在本文中,动态调整方案还处于初步的探讨阶段.
其他文献
期刊
随着国民经济的发展和科技的进步,网络在人们的生活中发挥着日益重要的作用,越来越多的人开始利用网络从事各类商务、办公、教学等活动。从本质上来讲,在网络环境下,对数据的
期刊
期刊
入侵检测技术是目前网络安全领域的一个研究热点,虽然目前入侵检测技术已经有了长足的进步,开发出了许多针对不同需要的产品,但传统的入侵检测系统仍然存在一些缺陷,例如在分
由于具有易于理解的优势,决策树成为最流行的分类方法之一。然而,利用已经存在的方法构建的决策树一般都会过于庞大、复杂化,因此在实际应用中实用性受到限制。此外,当今社会数据
现在,数据仓库技术已经日益成熟并在各个行业得到了广泛的应用。各电信公司、金融机构、政府机构和企业都正在或者着手建立自己的数据仓库,并在其基础上建立各种应用,进行决策支
本文针对现有版本管理方法的不足,提出了文档演化的内容与形式的自动处理方案。该方案不需保存中间版本,利用修改信息就可以展现文档的历史演变过程,显示版本间的修改痕迹,而
期刊
随着学术界对网格研究的进展和社会对网格服务需求的增长,如何把网格与具体行业进行结合已经成为一个新的研究和开发方向。目前网格服务已经开始了商业应用,IBM,Oracle等公司已