论文部分内容阅读
数据仓库和联机分析处理(OLAP)是企业获取决策支持的重要手段。由于OLAP要对各种维度的多维数据进行分析,通常要访问大量数据,进行复杂的连接、聚合操作,因此如何缩短响应时间,提高查询效率变得十分关键。实视图技术通过预先存储一些中间结果可有效提高查询的执行速度,但是实视图需要占用系统存储空间,而且要增加对视图进行维护的系统开销。因此,如何在给定存储空间限制下选择一组合适的视图进行物化,最大限度提高系统的查询响应性能是课题研究的关键。通常先利用用户的预估查询物化一部分视图,然后再根据系统运行中用户所做实际查询进行动态物化。本文首先在实视图的静态选择阶段提出了一个基于蚁群-遗传算法的实视图选取策略,在基本蚁群算法中融入遗传算法。蚁群进化过程中关注最优、最差路径,采用最大、最小信息素的更新方式,为蚁群进化指明方向,有效避免蚁群盲目搜索,提高问题求解速度。在迭代过程中对路径进行遗传、交叉和局部变异操作,增强算法的全局搜索能力,使其不容易陷入局部最优,在求解的准确性和速度上都有很大提高。实验结果表明该算法能有效解决算法“早熟”问题,同时也加快了解的收敛速度。在实视图动态调整阶段,本文提出一种改进的实视图动态批量调整策略,不是每执行一个查询语句立即进行调整,而是先收集一个统计周期内的查询,对此整体调整。算法先判断查询集合是否满足调整条件,若满足则根据视图访问频率生成候选视图,再调用实视图批量选择算法,若不满足则调用实视图集动态调整算法。由于查询集合能反应用户的查询趋势,该算法不需要频繁计算,就能保持实视图集对用户查询较强的适应性。实验结果表明该算法能有效避免“抖动”产生,增强视图集的稳定性。