论文部分内容阅读
通过OLAP查询可以快速发现数据背后隐藏的信息用以决策分析,但是OLAP查询在执行过程中往往需要对大量的数据进行选择、连接及投影操作,这是一个非常消耗时间及计算资源的过程。为了实现快速联机分析处理操作,可以引入物化视图来解决这个问题。物化视图是保存了预先计算好的查询结果的数据表。有了物化视图的支持,OLAP的查询就不必在原始的数据表上进行复杂的选择、连接、投影等操作,代之以从物化视图中获取所需的结果信息,从而缩短查询响应时间,提高查询效率。但是物化视图的引入又带来了新的问题,一是增加了数据仓库存储方面的开销,二是为防止物化视图失效,要对其进行定期刷新,维护数据量大并且计算复杂的物化视图将消耗大量的时间和计算资源。如何选择合适的视图进行物化从而使查询效率尽可能高,存储开销及维护开销尽可能小,这是物化视图选择要解决的问题;如何选择合适的方法对失效的物化视图进行快速的更新操作是物化视图维护要解决的问题。针对这两个问题,本文分别提出了基于遗传算法的物化视图选择方法以及基于数据世系的物化视图维护方法,主要研究工作和取得的成果如下:1.阐述了数据仓库中引入物化视图后面临的主要问题,分析了目前国内外关于物化视图选择及维护问题的研究现状,详细介绍了物化视图选择相关技术及物化视图维护相关技术。2.根据物化视图已经被证明是NP-hard问题的客观事实,提出一种基于遗传算法的物化视图选择方法。将多维数据格模型下的物化视图选择问题转化成遗传算法求最优解的问题,并把自适应调整交叉概率及变异概率的机制引入到遗传算法的求解过程中,加快算法的收敛速度,避免过早收敛。3.利用数据世系技术实现物化视图的增量维护,分别针对聚集物化视图及非聚集物化视图,提出了它们各自的增量维护模型及增量维护方法,并通过实验证明算法可行且性能较优。4.将基于自适应遗传算法的物化视图选择算法和基于数据世系的物化视图增量维护算法应用于运载工具分析系统中物化视图的选择及维护,提升了系统的查询响应效率,实现用最少的时间响应查询请求。