数据仓库中实体化视图联机维护的研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:meteora5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库是市场激烈竞争的产物,它将大量用于事务处理的数据库数据进行清理、抽取和转换,并按照决策主题的需要重新进行组织,以达到有效决策支持的目标。 数据仓库是多个分布的、异质的、自治的数据源的集成信息库。数据仓库中的信息以视图的形式存储,我们称之为实体化视图。它通过物理上的预先存储,加快了用户的查询响应时间,性能也得到提高。作为数据仓库技术研究的热点之一,实体化视图的联机维护是数据仓库联机维护技术中的一个关键技术。它是指,在数据仓库为用户提供服务的同时,当数据库中的原始数据发生改变时,系统能实时地将这种变化反映到数据仓库中,使相应的实体化视图得到即时的刷新。 论文在实体化视图增量维护方面进行了研究,主要涉及以下几个方面的工作: 1、理论概括与分析对数据仓库中实体化视图涉及的主要算法、主要技术、以及存在的问题进行深入的分析。 2、合并分布连接算法将实体化视图合并是数据仓库中实体化视图维护一个新课题。在分析传统合并方法的基础上,提出了一棵用于索引视图信息的合并树,并利用这棵合并树生成一组合并实体化视图的算法。实体化视图合并算法不仅减少了实体化视图的数量,有效的提高了实体化视图选择的质量,而且减少了存储的空间以及搜索的时间。通过分析可以看出,利用合并树实现的实体化视图合并算法较传统的方法,减少了合并的时间。在数据仓库的维护中,若实体化视图V中的数据来源于多个数据源,就会涉及到表的连接,即JOIN 算法。表连接操作在数据仓库的维护中占有重要地位,其算法直接影响视图维护的速度。由于人们仅对变化的数据感兴趣,因此,只要将涉及变化数据的连接结果追加至实体化视图V中即可,本论文采用触发器技术来监测源表信息的变化,并把变化信息提取到新的关系中,通过标志位判断是增加元组还是删除元组,根据响应队列顺序,执行相应的连接操作,并把最终的结果追加到实体化视图中。 3、算法性能分析本文在在研究现有增量维护算法的基础上,提出了合并分布连接算法,给出了算法的正确性证明,并通过与已有的算法的对比分析,结合图表,可以很直观的得出合并分布连接算法较之前的连接算法,减少了运算次数,有效的提高了运行的效率。并经过具体的实例分析,给出了算法的具体操作流程。
其他文献
计算机群集是一种把多台计算机组织起来,通过统一的资源整合与任务调度,模拟成一台功能更为强大的机器,通过分布式计算来协同完成各种任务的技术。随着计算机硬件性能的提高,计算
21世纪是信息的世纪,如何获得高速、准确的信息,并及时地交流和管理,已成为国家、企业和决策部门的迫切需要。地质环境变化是一种动态变化过程,其预测与防治研究是一项庞大的系统
随着Internet和计算机技术的飞速发展,嵌入式系统呈现巨大的市场需求,成为当今IT产业的焦点之一,其应用领域涉及通信、自动化、信息家电、军事等各个方面。但同时大量的嵌入式应
在网络时代,信息资源共享已经成为信息交流的一种重要方式。资源共享就是采用先进的科学技术,有组织有系统地对信息与文件进行整合,通过网络最大限度地为社会公众所用。 人们
随着技术的不断发展,开放网络环境越来越受到人们的关注。开放网络中没有中央服务器,网络中的每个节点都是对等的并且具有相同的能力。开放网络环境具有分布和开放的特点,网络结
地图是地理信息可视化的信息载体之一。地图整饰需要点、线、面符号和图例、比例尺、指北针等可视化要素,良好的可视化要素风格能使地图使用者迅速、准确的判读地理信息。本文
近年来,随着网络应用的快速发展,大型的分布式环境下的网络应用需求增加。而在分布式环境下出现的访问控制和授权管理问题作为网络安全服务的一个重要研究领域得到了众多学者的
信息技术投资是20世纪90年代企业界和学术界最热门的话题之一。许多大型跨国企业都把对信息技术的投入放在企业的战略位置上。经济学家认为,企业对信息技术的巨额投入必将对全
工作流时间管理是工作流领域的重要研究内容。开展工作流时间管理的研究,对于增强工作流管理系统的柔性、提高工作流各活动执行实体的协作效率、确保工作流计划的高效执行、提
数据挖掘是一种比传统的数据分析技术更加复杂的分析和建模方法,目的是发现数据中隐藏的规则和有用的知识。经过这些年的发展,数据挖掘已经逐渐从集中数据集的挖掘发展到多方