论文部分内容阅读
                            
                            
                                近几年,数据仓库技术在银行业、零售业、保险业、信用卡业务、医疗保健业、电信业等的应用,取得了很大的成效。煤炭系统因决策支持的需要,也产生了构建数据仓库的需求。本文在深入研究数据仓库技术的基础上,结合煤炭系统的行业特点,完成了同煤集团数据仓库系统的设计与开发。    数据仓库系统通过对海量数据存储和分析,为企业决策提供依据。数据的抽取与整合是构建数据仓库的首要任务。煤炭系统数据存在着时间密度小、空间密度大和缺乏完整性等特点,因此,在数据抽取过程中应适当的划分时间维度,管理数据时需要放大数据历史化的时间阈值,延长数据的使用寿命,同时用低级别的汇总数据进行分析。本文结合煤炭行业数据的特点,将数据仓库应用于煤炭系统,重点论述了数据仓库需求分析、确定主题域、系统建模、ETL过程和数据的管理与维护,并在数据仓库的基础上进行多维数据分析,利用微软决策树算法进行数据挖掘建模,把分析结果通过WEB工具展现给终端用户,提高企业各层管理人员的分析决策能力。