论文部分内容阅读
随着我国水利行业信息基础设施的不断完善,信息资源的开发利用得到了很大的重视。如何对海量的水情信息进行科学的分析处理、及时为决策者提供决策支持、适应水利信息化的要求、为流域经济发展和社会进步做出贡献,成为摆在水利行业面前的新课题。本文以淮河流域的沂沭泗水系对于水情信息处理的需求为背景,论述了数据仓库及数据挖掘技术在水利行业中的应用。 随着计算机信息技术的发展应用,我们已经为决策和控制积累了大量宝贵的数据,使得数据库技术得以迅速发展,数据库管理系统得以广泛应用。但是,数据量越来越大,而且将呈几何级数递增,如此大量的数据给数据的处理带来了很大困难。如何及时、有效地分析处理这些数据,从激增的数据背后挖掘出隐藏着的重要信息,为决策起到重要的支持作用已经越来越引起人们的关注。 二十世纪末,数据仓库(Data Warehouse-DW)与数据挖掘(Data Mining-DM)技术成为数据库应用与研究方面的热点,成为解决上述“肥数据瘦信息”问题的有效方法。数据仓库技术是数据库技术的进一步发展。它以传统的数据库技术作为存储和管理资源的基本手段,在组织和处理大量数据方面有重大的突破。数据挖掘技术是从大量数据中发现并提取隐藏在其中的可信的、新颖的、有效的并能被人理解的模式的高级处理过程。通过数据挖掘发现的知识能够反映一定的客观事实,并指导实践。 数据仓库与数据挖掘是应用驱动的,这就意味着,对具体的应用领域,应该度身定制自己的数据仓库与数据挖掘方案。在水利行业中,我们将这两种技术应用于水情数据的处理中,从中提取到大量的有用信息,有效地为决策提供了支持。本文研究和探讨了数据仓库与数据挖掘在沂沭泗流域的洪水预报与控制系统中的实现与应用,并从项目实践中得出了适合其特点的数据仓库与数据挖掘方案,为数据仓库及数据挖掘技术在水利行业内的实际应用提供了思路。本文首先在第一章绪论中,对整篇论文的选题背景、研究意义、内容和逻辑结构等方面进行了概括;接着第二章和第三章对数据仓库技术和数据挖掘技术相关知识做了简要介绍;第四章、第五章、第六章详细介绍了在沂沭泗流域内应