论文部分内容阅读
数据仓库技术的主要目的_在于更好地为用户提供决策支持。联机分析处理(Online AnalyticalProcessing,OLAP)是数据仓库提供的重要服务之一,也是用户获得决策支持的主要手段。OLAP系统用户能对数据进行多方何的,深入的分析,这种使刚方式对查询响应速度提出了很高的要求,使得提高OLAP查询和分析操作效率成为数据仓库应用中的关键问题之一。
本文是在参与一个数据仓库技术研究课题的基础上,着重对提高OLAP查询分析效率的索引技术、聚集Cube及OLAP查询优化等OLAP若干关键技术进行了系统深入的研究。本文的主要研究工作及其所取得的创造性成果有:
(1)研究了Data Cube的索引技术,提出一种能够处理复杂维层次结构情况的维层次编码。维层次编码充分利用了Data Cube中维的层次性及其语义特性,结合二进制编码与维层次结构编码对维成员值进行编码,通过二进制操作,可以快速检索出与查询关键字相匹配的维层次编码。同时,基丁维层次编码定义的层次链掩码,层次掩码及检索函数能够充分利用多维数据中的语义信息,实现基于语义的检索,减少了I/O开销,提高了OLAP查询效率。
(2)根据DataCube的语义特性及模式中维的层次性提出了多维数据之间的等价关系三<,HCov>,对Data Cube进行层次聚类。层次聚类Cube用等价类保存聚集记录,同时定义了等价类之间的人关系,以保存聚集记录之间的层次信息。这样,不但节省了存储空间,而且利用聚类信息及层次信息,可高效的进行各种OLAP查询,支持多维数据集上的上钻下钻、旋转等cube语义操作。同时,为OLAP查询导航、OLAP查询行为分析的实现提供了可能。
(3)提山了一种OLAP查询的Cache方案。以层次聚类Cube中的等价类作为Cache的基本单位,因而Cache的单位人小固定,易丁分配空间及进行替换,具有极高的效率与灵活性;通过定义oLAP查询中的各种运算,可以使用不同的方式利用Cache中的等价类,大大提高了Cache的性能。
(4)提出了一种OLAP查询集的优化方案。首先提出了一种单OLAP查询集的优化方案,然后在单查询集优化的基础上,对于给定的多个OLAP查询集,识别公共查询,根据各查询之间的关系进行整体优化,产生一个全局最优执行计划,从而减少了对磁盘的访问次数,缩短了查询执行时间。