论文部分内容阅读
数据挖掘技术是当今智能系统理论的重要研究内容,它综合运用人工智能、计算智能人工神经网、遗传算法、模式识别、数理统计等先进技术从大量数据中挖掘和发现有价值和隐含的知识。粗糙集理论是20世纪80年代初由波兰数学家Z.Pawlak首先提出的一种处理不精确、不确定和模糊数据的新型数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。近年来,粗糙集已成为人工智能和信息科学最活跃的研究领域之一,并且在数据挖掘、模式识别、机器学习、知识发现、决策分析等领域得到成功的应用。经典粗糙集主要用于处理分类数据或是多值离散型数据,然而现实世界中信息系统是非常复杂的,许多测量值通常以区间数据的形式来描述。经典粗糙集方法对于区间数据的粗糙近似、属性约简以及决策规则提取还没有定义。当前的粗糙集方法还不能支持对区间数据的处理。针对这类问题,目前已有少数研究者提出了灰色粗糙集模型。但现有的灰色粗糙集模型对这类问题的处理还不够完善,为此,论文对此进行了深入研究,提出了一些解决方法。论文首先介绍了灰色系统理论以及粗糙集理论,然后介绍了现有的灰色粗糙集模型,并对其进行了深入分析。在指出它们的局限性后,论文提出了一种基于灰色相容关系的灰色粗糙集模型,并进一步定义了上、下近似集,同时还对该模型的有关性质进行了分析。在建立模型后,需要考虑的问题是属性约简。已有证明显示,求得所有约简和最小约简均是NP-Hard问题。目前出现了很多启发式算法,但基于分辨矩阵的约简算法是主流。论文提出了灰色决策信息系统的分辨矩阵的求法,并分析了分辨矩阵的相关性质。在此基础上,论文结合Jelonek和HORAFA两种属性约简算法,提出了基于灰色相容关系灰色粗糙集的属性约简算法。该算法对协调与不协调的灰色决策信息系统同样适用,并且在通常情况下能求出信息系统的所有属性约简集。在得到属性约简集后,接下来进行了规则提取工作。给出了决策规则提取的相关知识,通过研究决策树的构造方法提出了论文基于灰色相容关系灰色粗糙集的决策树规则提取方法。论文对每一个模型或算法都用MATLAB进行了程序实现,其后还给出了算例分析,以此验证这些模型及算法的有效性。