论文部分内容阅读
随着科学技术的发展和实际生产的需要,数据仓库技术的应用越来越广泛。数据仓库系统的性能越来越被重视,特别是对一些大型的企业来说。在现有的数据仓库优化技术中,大多数主要集中于与某个特定数据仓库系统相关的SQL语句的优化,而对于数据仓库的物理结构这方面的优化研究则相对较少。本文从数据仓库物理结构设计方面出发,结合实际应用需求,对数据仓库的调整优化技术进行了研究,主要工作如下:1.对数据仓库物理结构的优化研究。针对Shared Pool结构、基本框架的主要特点以及现有的Bucket划分模型,进行了深入的讨论,通过对模型划分理论与规划的分析后,提出了一种改进的Shared Pool共享池Bucket划分算法,改进措施是在对Bucket进行划分时,先对Bucket数量进行调整,确定各部分划分范围;然后在划分Bucket的步长进行改进,改变Size大小,将小概率Bucket数量降低,提高存放相对较小的内存块(Chunk)的Bucket数量。2.提出了一种新的Buffer cache的优化算法,其主要措施为针对过多Latch管理,争用频繁的并发访问损坏内存中数据的问题,采用增加Bucket,每一个Latch映射多个Bucket的新映射方法,达到使用较少Latch来管理更多Bucket的目的,使算法性能得到优化。3.针对PGA研究,主要采用反馈环(Feedback Loop)算法实现PGA自动管理和如何优化PGA的大小,并从等待事件和数据块方面相结合来优化数据仓库的性能。本文以步步高商业连锁股份有限公司的数据仓库系统为应用实例,在优化应用中,对于数据仓库系统的性能,对系统的数据进行了检查、收集、统计,详细对比和分析了相关的数据信息,从而验证了改进后的算法和措施对数据仓库的性能起到了优化的作用。