论文部分内容阅读
数据库的广泛应用,大量数据的积累,使得数据挖掘引起了信息产业界的极大关注。粗糙集理论在机器学习、知识获取、智能控制、决策分析、知识发现、专家系统和模式识别等领域取得了一些成功的应用。本文以粗糙集理论为工具,对数据挖掘的方法和过程进行详细的研究。介绍了数据挖掘的概况,粗糙集理论的基本内容及粗糙集在知识表达系统和决策表中一些应用,研究了粗糙集理论的知识发现、规则约简及属性约简问题。本文主要研究内容如下:第1章介绍了研究的目的和意义,阐述了国内外的研究发展现状,概括了文章的研究内容和结构安排。第2章介绍了数据挖掘和粗糙集的基本理论,知识表达系统和决策表。包括数据挖掘的理论和方法,及数据挖掘的步骤,集合的近似与粗糙集,规则约简与知识的依赖性,知识表达系统及决策表的约简,决策规则,研究了粗糙集理论在知识表达系统与决策表中的应用情况。第3章研究了确定性规则约简集的发现问题。首先介绍了一些相关的概念,提出了规则集优化的问题,给出了一个找出确定性规则约简集的算法,并证明了该算法具有可靠的理论基础,用一个算例验证了算法的可行性和有效性。第4章研究了不完备信息系统规则优化问题。在完备信息系统的基础上,提出了不完备信息系统描述子的约简,用描述子描述了优化决策规则的求法,进一步研究了不完备信息系统的Gs约简和Ds约简,可以看出它是完备决策表下定义的近似约简的推广。第5章研究了无核简化差别函数及其求解方法。在简化差别函数的基础上,给出了基于无核简化差别函数的概念。通过无核简化差别函数求解决策表的约简,可以解决求解辨别函数时需要消耗很大的时间和空间开销的问题。第6章总结与展望对全文的研究工作进行了总结,同时,对下一步的研究工作进行展望。