论文部分内容阅读
在信息技术高速发展和激烈市场竞争的今天,企业管理者如何从来自不同数据源的大量的数据中得到良好的决策支持,这就产生了数据仓库技术。本文从数据集成、查询优化和并行技术三个方面、对数据仓库的性能进行了研究和讨论。在进行数据集成的时候对不同的数据源采用不同的策略,对数据仓库平台中休眠数据的处理我们要根据其产生的特点,预先评估数据的可靠性和价值方面的问题,可以在数据集成的时候将不必要的数据拒之门外,对查找出的休眠数据采用不同的方法从数据仓库中删除它们。当大量的企业内部数据和复杂的外部数据不断进入数据仓库以后,如果用软件的方法和现有的条件已经无法改善它的性能的时候,则必须通过使用并行硬件和并行软件技术来扩展原有的结构以适应新环境要求。本文的第五章中我们建立了一个考试数据仓库平台,通过使用该平台,管理者和用户可以很方便地查询考试方面的信息,我们在数据集成时对文本文件等信息处理和休眠数据的处理、数据的分割和布纹等方面取得了较好的效果。