论文部分内容阅读
BI是继ERP,CRM之后的新的信息系统,旨在解决企业管理信息化之后,需要面对企业决策过程的信息化的难题。企业的运营状况的好坏主要决定于决策,而决策的依据又是靠经验,经营数据,各种决策方式来保证的。BI系统应运而生,使用已有数据,挖掘潜在商业规律,抓住先机,帮助企业运筹帷幄之中,决策千里之外。ETL是Extraction-Transformation-Loading的缩写,中文名称为数据提取,转换和加载。ETL是BI的灵魂,是BI系统成功的基石,只有实施成功了ETL系统,BI系统才会变得更有价值。ETL的价值在于把数据统一化,标准化,可视化,集中化。数据仓库实现解决信息孤岛的问题,ETL则实现连通信息孤岛的桥梁。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。本文主要阐述,结合多年实施数据仓库,ETL,BI系统的经验,总结ETL工具主要包括的功能和实施难度,通过编程工具实现一个通用化的ETL系统,主要依靠数据库和编程工具的特性来实现相应的功能需求。目的是简化ETL的开发环节,增强ETL工具的可用性,为ETL的项目开发解决时间与人力成本。