论文部分内容阅读
计算机网络与数据库技术的迅速发展和广泛应用使得企业管理进入一个崭新的时代,数据处理的重点从传统的业务处理扩展到在线分析处理。随着企业事务处理系统的运行和建立,数据量越来越大,企业数据源越来越多,这种需求就比以往任何时候都更加迫切,也更加难于实现,数据仓库技术就是针对上述问题而产生的一种技术解决方案,它是基于大规模数据库的决策支持系统环境的核心。但是数据仓库的应用不仅如此,数据仓库最吸引人的东西是数据仓库构成了许多其它各种形式的处理的基础。 联机分析处理技术(On Line Analytical Processing,OLAP)和数据挖掘技术(Data Mining,DM)均是决策支持的重要技术,两者在决策分析过程中可以分工合作、功能互补。但是两者的产生背景、发展历程、数据基础、分析层次、用户群等方面存在着较大的差别,这妨碍了两者在决策支持应用中有机、高效的结合。为了减少或消除这种差别,实现联机分析处理技术和数据挖掘技术的紧密结合,J.W.HAN于1997年提出了OLAM的概念,即OLAP Mining,他从统一两者的数据基础入手,提出在多维数据模型的基础上同时支持OLAP应用和数据挖掘应用的思路。浙江大学曹蓟光博士在此基础上对OLAM的概念进行了扩展,对OLAM的内涵进行了深化,把OLAM定义为联机分析挖掘处理(On Line Analytical Mining Processing),实现对OLAP技术和数据挖掘技术的紧密集成。OLAM的数据基础不再局限于多维数据模型,而是包括多维数据模型、关系数据模型、对象数据模型和对象关系数据模型、半结构或无结构化数据模型等多种模型的异构环境。本文在曹蓟光博士研究的基础上重点研究了OLAM系统中元数据的管理。 元数据存在于企业的各种应用和软件工具中,是实现商业流程重组的重要依据,在应用程序开发中,实现开发工具一体化,离不开元数据。同时,元数据使多个开发者参与的数据建模与设计同步问题得以解决,使应用程序包最大限度的满足企业的不同需求,元数据管理是解决数据仓库一体化、一致性、系统化及可用性问题的有效方法。元数据是OLAM系统的核心,论文在对元数据概念、作用、管理的主要内容、策略、标准化问题进行分析的基础上,根据CWM模型,提出了OLAM系统中元数据的整体结构及其系统框架,并分析了OLAM元数据管理的关键技术。最后讨论了元数据仓储的具体实现、元数据管理系统的设计原则及元数据库的建立。 OLAM作为一种新的决策开发应用技术,尚处于发展的初期,考虑到元数据是OLAM系统的核心,论文从元数据管理的角度对OLAM技术的理论框架进行了研究,为OLAM技术的进一步发展奠定了基础。