论文部分内容阅读
数据仓库技术是信息技术领域的一门新兴技术。采用数据仓库技术,可以充分利用企业内部已有的海量数据资源,从中挖掘出有价值的知识和规则,支持企业决策,将客观详实的数据经验与决策者自身的宝贵经验有效的结合起来,提高企业的市场竞争力。 本文简述了数据仓库产生的背景以及在国内外的发展现状,对于数据仓库的概念、数据特征、数据组织结构、体系结构、粒度、元数据、数据分割等基本理论进行了一定的分析研究。 本文研究了创建数据仓库的方法、模型和步骤。创建数据仓库系统的过程大致可分为三个步骤:数据库设计和创建、数据迁移、数据查询分析。数据仓库系统中数据库的设计,采用信息打包的设计方法。数据库的信息打包设计法通过建立信息包图、星型模式、物理数据模型三种数据模型来创建数据仓库。它们分别对应传统数据库的概念模型、逻辑模型和物理模型。数据迁移主要研究数据校验、数据清洗、数据转换和数据加载等方面的问题。数据查询分析则主要采用联机分析处理(OLAP)和数据挖掘的方法。 微软公司发布的关系型数据库管理系统SQL Server 7.0给出一种新的数据仓库解决方案。数据仓库的实现需要有许多支持工具来共同完成,本文介绍了SQL Server 7.0提供的数据仓库支持工具,包括OLAP服务、数据转换服务、PivotTable服务、英语查询服务等。同时本文还介绍了一种开放式的体系结构——Microsoft的数据仓库框架。 在研究数据仓库技术理论的基础上,结合连锁超市企业的具体业务,本文给出了连锁超市配送决策支持系统的一种数据仓库解决方案,构建了面向连锁超市配送决策的数据仓库,并探讨运用联机分析处理和数据挖掘的手段进行数据查询分析,为配送提供决策支持的方法。 数据仓库的数据来自于对联机事务处理数据库中数据的综合、归纳、集成和抽象。在设计面向连锁超市配送决策的数据仓库之前,本文首先分析了连锁超市信息管理系统物理数据库中主要数据表的组成结构、数据项的意义以及配送系统的业务流程和信息流程。 遵循创建数据仓库系统的三个步骤,本文构建了连锁超市配送决策支持系统的数据仓库。 一 在数据库设计和创建阶段,本文首先深入了解连锁企业业态、连锁超 市配送系统业务流程和信息流程,在此基础上,进行了需求分析。然后采 用信息打包的方法,进行维度、粒度、量度、计算的设计,建立面向配送 支持的数据集市的信息包图。而后,根据超市配送系统所涉及的工作和抉 策分析的需求,设计销售立方体的星型模型,确定立方体的维度表和事实 表的结构。最后,使用 SQL Server 7.0,创建物理数据库 STARBS。 在数据迁移阶段,所作的主要工作是将连锁超市销售系统中的数据提 取出来,进行清洗和转换,按照面向主题的数据特征重新进行组织,加载 到物理数据库STAA13S中。确定数据源后,在阶段性区域一中间数据库 MIDSTARBS中建立与数据仓库的维度表和事实表相对应的中间数据表。 利用 SQL Server 7.0的数据转换服务 DTS组件,从 OLTP数据源抽取数据, 并进行数据校验和转换,将数据迁移到中间数据库中,再对中间数据表进 行查询,将数据加载到数据仓库的物理数据库中。 在数据查询分析阶段,利用 SQL Server 7刀的 OLAP Services组件建立 面向连锁超市配送决策支持的OLAP数据库STARBS DSS。根据前面的分 析,确立面向销售的立方体(Sales)的事实表和维度。对立方体进行处理, 创建物理立方体Sales。使用多维立方体查询语言MDX,对立方体进行多维 分析。本文介绍了该系统可以进行的分析并给出实例。 本文介绍了连锁超市配送决策支持系统的主要功能和功能模块。系统 平台为 Microsoft Windows98,数据库平台选用 Microsoft SQL Se。er 7.0。 开发工具选用 Sybas。。Power Builder 7.0。系统的主要功能是制订、生成配 送计划和需求计划,同时具有强大的查询功能。 本文针对连锁超市配送决策支持系统存在的不足,对系统模型的完善 和改进提出了建议和看法。模型的构建基于一种理想情况,实际中某些数 据对模型造成冲击,影响分析结果,因此可采用设定阀值的方法修正干扰, 增强模型稳定性。用户对不同时期不同类型的数据的关心程度并不相同, 可以在模型中使用“加权”的方法来反映数据重要性这一影响因素。 最后,本文总结了数据仓库系统开发过程中需要注意的问题,并展望 数据仓库技术未来的发展方向。