论文部分内容阅读
数据挖掘是当前知识发现领域中的一个研究热点,本论文的主旨是研究如何通过基于粗集的值约简实现数据挖掘。值约简事实上是在求得属性简式的基础上,针对每条规则,将规则尽可能的泛化,使每条规则更趋简练,也更具有代表性,更重要的是,它通过离散化对全体数据进行约简,使整个数据量降低,从而提高了挖掘的效率,降低了时间复杂度。文中给出了基于粗集的数据归约、概念层次的自动生成、识别矩阵求简式的方法。 在理论工作的基础上,我们设计并实现了一个基于粗集的数据约简的原型系统。该原型系统分为数据预处理、数据约简、规则生成和决策算法四大组成部分。该原型系统基本上实现了上述各种方法,用于验证方法的有效性及测试算法的效率。