论文部分内容阅读
围绕数据库的高层管理阶段(即知识管理阶段)中数据仓库的设计与实现这个课题,结合数据挖掘、数据库中的知识发现(KDD)等内容,本文进行了如下的一些研究与实践。主要工作如下:1.以知识管理为中心,提出了有关数据仓库定义的解释、框架及其组成部分, 研究了高层管理阶段数据集成、知识集成的问题。2.详细解释了数据仓库所涉及的理论、发展趋势以及实现数据仓库的相关技 术,从而有区别于DBS的理论、应用等。这对成熟的DBS理论中又有了新的 应用,为进一步在现有的DBS中挖掘有价值的信息提供了可靠的理论依据。3.对于多平台的网络系统,采用SQL中的Cube技术解决了三维以上的超维问 题数据结构问题,从而使得数据仓库摆脱了传统的二维关系表格的数据结构 的存储方式,为多个平台的信息集成、知识集成提供了先进的处理手段。4.在数据仓库访问组成部分中,详细叙述了数据挖掘的定义、方法和目标。 在数据挖掘过程中以银行业务为背景,有效地对银行的贷款的风险进行了预 测。在预测与分析中,利用多种模型对某个主题(实际问题)的样本数据进 行了预测,经过预测结果的比较与评价后,结合样本数据发展的趋势选出一 种最优的模型,这对于市场经济迅猛发展的今天,是非常重要的。5.针对知识发现,研究了有关相联规则的问题。在KDD定义、过程形成基础 上,对相联规则在实际中的应用价值进行了分析与研究。从实际的销售、银 行的贷款分析、病理分析等出发,提出了改进的Apriori算法,解决了在大 型的DBS中KDD的难点问题,即知识发现的算法问题。该方法可用以解决医 学、诊断、报警、贷款预测分析、大型零售商的货物分析等的相关领域的问 题。实践表明,该方法是目前KDD中优秀的算法,在决策支持中起着重要的 作用。