论文部分内容阅读
摘要:长期以来,数据仓库以其海量的数據存储、复杂的技术要求、巨额的资金投入等特点,似乎成为大型企业的专利。但更多的中小企业,在面对日益激烈的市场竞争和高度信息化的今天,对数据仓库也提出了强烈的渴求。本文主要分析数据仓库的使用现状及对在中小企业中实施数据仓库工程的可行性进行探讨。
关键字:数据仓库;中小企业;
中图分类号:TP311.11
一、 数据仓库及其使用现状
数据仓库的概念是由数据仓库之父比尔.恩门(Bill Inmon)在1991提出的。数据仓库有别与传统的数据库,它是一种面向主题的、集成的、相对稳定的、反映历史变化的数据集合,主要用于数据挖掘和决策支持。
与数据库管理系统不同,数据仓库并不是一个软件产品,数据仓库的建立也不像数据库的建立那样相对孤立、简单,更准确的说法是数据仓库的建立是一项循序渐进、不断反复的系统工程。数据仓库的建立大致有以下这些步骤:1、收集和分析业务需求;2、建立数据模型和数据仓库的物理设计;3、定义数据源;4、选择数据仓库技术和平台;5、从操作型数据库中抽取、净化和转换数据到数据仓库;6、选择访问和报表工具;7、选择数据库连接软件;8、选择数据分析和数据展示软件;9、更新数据仓库等。
分析以上步骤,可以总结出数据仓库的建设可能需要企业具备以下这些条件:1、完善的事务处理型信息系统。如果将信息系统按照其应用的层级来划分,可以分为底层的事务处理型信息系统、中层的管理信息系统和高层的决策支持系统。数据仓库的一个最重要的作用就是进行数据挖掘,从而为决策的指定提供依据,而数据从哪里来,如果单独从内部数据来说,大量就来自于底层的各种事务处理型信息系统,以沃尔玛这个超级连锁航母来说,她动辄TB数量级别的数据就来自于类似POS销售终端这样的事务处理型信息系统中。2、海量的原始数据。就如条件1中所描述,数据仓库建立的目标是为了从海量的数据中找出数据中的规律,从而为决策提供支持,所以海量的原始数据积累必不可少。3、数据仓库配套软件。数据仓库的创建必然离不开类似数据仓库数据库、数据抽取、数据转换等这些相应软件的支持。4、海量的硬件存储设备。在数据仓库中需要存储大量的历史数据,以供分析、报表生成等使用,为此需要准备多种规格类型的海量存储设备,例如摆放访问频率较高数据的快速存储设备、摆放访问频率很低的磁带存储设备等,同时还要能够在这些设备间做到数据的快速转换等工作。5、专业的技术团队。前面说到过,数据仓库的建立是一项循序渐进、不断反复的系统工程,从来不要设想一次就能够创建出令企业彻底满足的数据仓库,同时又加之数据仓库的创建需要用到大量的专业知识,所以一支专业的技术团队的长期支持是必不可少的。
介于上面的分析与考虑,似乎对于中小企业来说,很多条件都不具备,只有那些很早以前已经开始重视企业信息化建设的大型企业才有这样的条件来建设数据仓库,这样的观点几乎已经成为了企业届和软件行业的共识,造成的结果就是目前来说,在中小企业中几乎很难见到数据仓库的使用,没有数据仓库,数据挖掘也就无从谈起,没有数据挖掘,决策也就更多的是依赖于主观的判断,也就谈不上科学的决策制定,中小企业对于信息化的利用也就迟迟停留在一个较低的层次。
二、中小企业建设数据仓库的优劣分析
既然在上述内容中提出的关于数据仓库的建立有那么多的必备条件,而中小企业对于这些条件又都不能达到,那么中小企业是不是就不能建立数据仓库呢?回答应该是否定的。
从相对论的角度来说,凡事都有两方面,如果换一个角度来看待中小企业在数据仓库建立方面的劣势,也许就变成了优势。1、对于完善的事务处理型信息系统来说。完善的事务处理型信息系统是数据仓库中海量数据的重要来源,但是对于大型企业来说,由于一般情况下,这些事务处理型信息系统在建设初期并没有考虑到为将来数据仓库提供数据使用,这样就必须借助一些数据采集工具来对原有的事务处理型信息系统进行数据采集,例如磁盘扫描、触发器等,但对于中小企业来说,由于事务处理型信息系统也处于建设中,就可以进行整体规划,从而选择最优方案。2、对于海量的原始数据和存储设备来说。数据仓库是用来进行数据挖掘使用的,而数据挖掘必然需要大量的数据做参考,对于中小企业来说,虽然按照中国俗语不能一口吃成个胖子,但是也绝对有必要开始对原始的数据开始整理与收集,从而为将来的使用做准备,而初期的数据量相对较少也为中小企业在硬件方面的投入减轻了不少压力。3、对于数据仓库配套软件来说。中小企业在初期的数据量不是特别大,可以使用一些低成本的数据仓库数据库,例如SQL Server 2000等,在将来数据量大的时候可以进行平滑的数据过渡。4、对于需要专业技术团队这方面。在初期由于业务量小,相应的使用数据仓库的部门也不是很多,这样对于数据集市的要求和报表需求也不是特别复杂,可以将数据仓库的设计交由软件外包公司进行定制,但相应的外包公司要有一定的资质和稳定的技术人员,同时对于建设过程中的文档要尽可能详尽,从而以便将来的升级和优化处理。
这样分析下来,其实对于中小企业来说,尽早的投入数据仓库的建设并不是不可能。
三、中小企业数据仓库使用展望
据国家经济统计局统计,全国共有200万家小型企业,120万家中型企业,50万家大型企业,中小企业占到了总企业数的86%多。随着整个社会信息化程度的不断提升,以前那种粗放型的生产经营管理模式已经不能跟上商业发展的步伐,而集约型的管理模式则需要更多的科学的决策支持,而科学决策的制定又离不开量化的数据支持,所以数据挖掘以及商务智能大有可为,而这些又都离不开数据仓库的支持。现在,越来越多有远见的企业领导已经开始关注到信息数据的积累以及数据仓库的使用对于企业发展的重要性,而在这个庞大的企业大军中,中小企业对于数据仓库的渴求必然将成为未来最大的市场呼声。
作者简介:
李红育(1983-),男,河南新郑人,软件工程硕士,讲师、工程师,主要研究方向:软件工程、系统集成、数据仓库、移动互联。
顾东虎,(1980-),男,汉族,山西大同人,本科,讲师、工程师职称;主要研究方向:软件工程、嵌入式系统及数据存储。
关键字:数据仓库;中小企业;
中图分类号:TP311.11
一、 数据仓库及其使用现状
数据仓库的概念是由数据仓库之父比尔.恩门(Bill Inmon)在1991提出的。数据仓库有别与传统的数据库,它是一种面向主题的、集成的、相对稳定的、反映历史变化的数据集合,主要用于数据挖掘和决策支持。
与数据库管理系统不同,数据仓库并不是一个软件产品,数据仓库的建立也不像数据库的建立那样相对孤立、简单,更准确的说法是数据仓库的建立是一项循序渐进、不断反复的系统工程。数据仓库的建立大致有以下这些步骤:1、收集和分析业务需求;2、建立数据模型和数据仓库的物理设计;3、定义数据源;4、选择数据仓库技术和平台;5、从操作型数据库中抽取、净化和转换数据到数据仓库;6、选择访问和报表工具;7、选择数据库连接软件;8、选择数据分析和数据展示软件;9、更新数据仓库等。
分析以上步骤,可以总结出数据仓库的建设可能需要企业具备以下这些条件:1、完善的事务处理型信息系统。如果将信息系统按照其应用的层级来划分,可以分为底层的事务处理型信息系统、中层的管理信息系统和高层的决策支持系统。数据仓库的一个最重要的作用就是进行数据挖掘,从而为决策的指定提供依据,而数据从哪里来,如果单独从内部数据来说,大量就来自于底层的各种事务处理型信息系统,以沃尔玛这个超级连锁航母来说,她动辄TB数量级别的数据就来自于类似POS销售终端这样的事务处理型信息系统中。2、海量的原始数据。就如条件1中所描述,数据仓库建立的目标是为了从海量的数据中找出数据中的规律,从而为决策提供支持,所以海量的原始数据积累必不可少。3、数据仓库配套软件。数据仓库的创建必然离不开类似数据仓库数据库、数据抽取、数据转换等这些相应软件的支持。4、海量的硬件存储设备。在数据仓库中需要存储大量的历史数据,以供分析、报表生成等使用,为此需要准备多种规格类型的海量存储设备,例如摆放访问频率较高数据的快速存储设备、摆放访问频率很低的磁带存储设备等,同时还要能够在这些设备间做到数据的快速转换等工作。5、专业的技术团队。前面说到过,数据仓库的建立是一项循序渐进、不断反复的系统工程,从来不要设想一次就能够创建出令企业彻底满足的数据仓库,同时又加之数据仓库的创建需要用到大量的专业知识,所以一支专业的技术团队的长期支持是必不可少的。
介于上面的分析与考虑,似乎对于中小企业来说,很多条件都不具备,只有那些很早以前已经开始重视企业信息化建设的大型企业才有这样的条件来建设数据仓库,这样的观点几乎已经成为了企业届和软件行业的共识,造成的结果就是目前来说,在中小企业中几乎很难见到数据仓库的使用,没有数据仓库,数据挖掘也就无从谈起,没有数据挖掘,决策也就更多的是依赖于主观的判断,也就谈不上科学的决策制定,中小企业对于信息化的利用也就迟迟停留在一个较低的层次。
二、中小企业建设数据仓库的优劣分析
既然在上述内容中提出的关于数据仓库的建立有那么多的必备条件,而中小企业对于这些条件又都不能达到,那么中小企业是不是就不能建立数据仓库呢?回答应该是否定的。
从相对论的角度来说,凡事都有两方面,如果换一个角度来看待中小企业在数据仓库建立方面的劣势,也许就变成了优势。1、对于完善的事务处理型信息系统来说。完善的事务处理型信息系统是数据仓库中海量数据的重要来源,但是对于大型企业来说,由于一般情况下,这些事务处理型信息系统在建设初期并没有考虑到为将来数据仓库提供数据使用,这样就必须借助一些数据采集工具来对原有的事务处理型信息系统进行数据采集,例如磁盘扫描、触发器等,但对于中小企业来说,由于事务处理型信息系统也处于建设中,就可以进行整体规划,从而选择最优方案。2、对于海量的原始数据和存储设备来说。数据仓库是用来进行数据挖掘使用的,而数据挖掘必然需要大量的数据做参考,对于中小企业来说,虽然按照中国俗语不能一口吃成个胖子,但是也绝对有必要开始对原始的数据开始整理与收集,从而为将来的使用做准备,而初期的数据量相对较少也为中小企业在硬件方面的投入减轻了不少压力。3、对于数据仓库配套软件来说。中小企业在初期的数据量不是特别大,可以使用一些低成本的数据仓库数据库,例如SQL Server 2000等,在将来数据量大的时候可以进行平滑的数据过渡。4、对于需要专业技术团队这方面。在初期由于业务量小,相应的使用数据仓库的部门也不是很多,这样对于数据集市的要求和报表需求也不是特别复杂,可以将数据仓库的设计交由软件外包公司进行定制,但相应的外包公司要有一定的资质和稳定的技术人员,同时对于建设过程中的文档要尽可能详尽,从而以便将来的升级和优化处理。
这样分析下来,其实对于中小企业来说,尽早的投入数据仓库的建设并不是不可能。
三、中小企业数据仓库使用展望
据国家经济统计局统计,全国共有200万家小型企业,120万家中型企业,50万家大型企业,中小企业占到了总企业数的86%多。随着整个社会信息化程度的不断提升,以前那种粗放型的生产经营管理模式已经不能跟上商业发展的步伐,而集约型的管理模式则需要更多的科学的决策支持,而科学决策的制定又离不开量化的数据支持,所以数据挖掘以及商务智能大有可为,而这些又都离不开数据仓库的支持。现在,越来越多有远见的企业领导已经开始关注到信息数据的积累以及数据仓库的使用对于企业发展的重要性,而在这个庞大的企业大军中,中小企业对于数据仓库的渴求必然将成为未来最大的市场呼声。
作者简介:
李红育(1983-),男,河南新郑人,软件工程硕士,讲师、工程师,主要研究方向:软件工程、系统集成、数据仓库、移动互联。
顾东虎,(1980-),男,汉族,山西大同人,本科,讲师、工程师职称;主要研究方向:软件工程、嵌入式系统及数据存储。