论文部分内容阅读
数据仓库的出现和发展是计算机应用到一定阶段的必然产物。经过多年的计算机应用和市场积累,许多商业企业已保存了大量原始数据和各种业务数据,这些数据真实地反映了商业企业主体和各种业务环境的经济动态。然而由于缺乏集中存储和管理,这些数据不能为本企业进行有效的统计、分析和评估提供帮助。也就是说,无法将这些数据转化成企业有用的信息。数据挖掘和数据仓库技术是信息技术领域的一门新兴的技术。数据挖掘是利用分析工具从不完全的、大量的、模糊的、有噪声的、随机的数据中,提取出隐含在其中的、事先未知的、但是又潜在有用的知识和信息的过程,建立起数据间关系模型,并用其做预测。数据仓库的最主要特点是面向集成性、主题性、非易失性、时变性。采用数据仓库技术,可以满足利用己有的大量数据资源,从中挖掘出有用价值的规则和知识。随着经济全球化趋势的愈发加强,公司的销售总量也在随之有非常大的提升,原本为销售人员计算工资的系统随着业务的增长,处理数据量急剧增加,数据的存储和处理就成为了一个问题。本论文针对上诉问题,以公司XXX系统为研究对象,在深入分析数据仓库的原理上,对公司XXX系统数据仓库建立的问题做了详细的阐述。本文共分7个部分,第一部分是绪论,介绍课题的意义和背景,数据挖掘和数据仓库技术的现状;第二部分是介绍公司XXX系统的现状和缺陷,详细分析建立数据仓库的必要性;第三部分是数据仓库的设计,详细介绍了数据仓库各个模块的设计,包括IFACE表,自动化传输模式,权限控制,数据存档和一些作业的详细设计;第四部分是数据仓库的实现,详细阐述了本设计实现方法和思想,详细介绍系统是如何实现的;第五部分是数据挖掘工具COGNOS,介绍了数据仓库后续数据挖掘的报表是如何产生的,以其工具的截图;第六部分是数据仓库的测试,详细介绍了测试流程和测试点以其是怎样测试的,并给出测试报告分析;第七部分是结束语,总结了数据仓库设计和开发过程中的经验和不足,以其有待提高的部分。