论文部分内容阅读
决策支持系统、数据挖掘技术目前已得到了广泛的应用,作为这两者的信息来源数据仓库和数据集市技术也得到了相应的发展。数据仓库和数据集市的重要性在于它为决策支持系统和数据挖掘提供了一个数据环境,因而数据集市和数据仓库技术的重要性是显而易见的。目前,对数据仓库的研究大多集中于如何对数据进行抽取、装载、清洗、计算、聚合等过程上,以及如何改善数据仓库的物理存储结构,提高存储空间的利用效率上,而对数据仓库自身的管理则很少引起人们的注意。然而,随着新的信息源的加入,新的应用需求的提出,因此,如何对数据仓库的运行过程加以管理,使得数据仓库能够自动地适应这种变化,同时也支持数据仓库不断地演化,就显得特别重要了。本论文正是基于上述现状,首先对数据仓库的现有理论进行了详细的介绍,然后在此基础上提出了基于元数据的数据仓库运行过程管理模型,通过这个模型能够使一些复杂的活动、活动的内部关系、活动与活动之间的关系模型化,利用该模型中的实体来实现数据仓库的设计、管理、以方便数据仓库的演化。最后对上述方法进行了实例研究,验证其正确性。