论文部分内容阅读
粗糙集理论在自然科学、社会科学和工程技术的很多领域中都有广泛应用,特别是在数据挖掘、人工智能、管理决策和诊断预测等方面起到了重要作用。现在对粗糙集的研究主要集中在三个方面:一是粗糙集的推广;二是粗糙集约简算法的设计;三是粗糙集的应用。其中粗糙集的约简是粗糙集理论中最重要、最具特色的研究,也是被应用得最多、最广泛的理论。作为Pawlak经典粗糙集的重要推广,覆盖广义粗糙集近年来颇受关注。但其研究的重点主要是覆盖近似算子的提出,而对覆盖约简理论的研究还远远不够。在覆盖粒约简方面,Zhu等作出了开创性的工作,首次提出并约简这一粒约简方法。但是,并约简理论只适用于第一和第三型覆盖粗糙集。对于其余五种类型,不是可能导致过度约简,就是导致约简不充分。所以,为了建立起对于所有覆盖粗糙集都适用的粒约简理论,我们首先给出了新的逼近空间定义,并在此基础上建立了适用于七种覆盖粗糙集模型的粒约简理论,提出了覆盖粒约简算法。这对于可能出现的新覆盖逼近算子,也提供了约简理论基础。在覆盖信息系统属性约简方面,Tsang等基于传统的区分矩阵方法设计了第五型覆盖粗糙集模型的属性约简算法,但其余六种模型的属性约简算法至今无人问津。我们基于本文的逼近空间理论,首先发现第六和第七型覆盖粗糙集的属性约简方法与第五种一致。然后,对于第一、第二,第三和第四种模型,我们证实了传统的区分矩阵方法无法解决其约简问题。针对这一难题,我们首次提出了基于逼近空间的相关族算法,解决了所有覆盖粗糙集属性约简的问题。同样地,我们利用相关族算法,也顺利解决了七种覆盖决策系统的相对属性约简问题。相关族算法不仅可以解决前四种模型的属性约简和相对属性约简问题,对后三种模型也同样奏效。拓扑学是最经典的数学理论之一,覆盖与拓扑存在天然的联系,研究覆盖的拓扑性质具有理论和实际的双重意义。但以往的研究均侧重于逼近算子的拓扑性质和粗糙粒子的拓扑结构,对于覆盖约简拓扑性质的研究却是一片空白。我们发现覆盖的N-约简就是覆盖所生成拓扑的极小子基,并且拟可表示覆盖,可表示覆盖和unary覆盖都具有很好的粒约简性质。另外,我们还研究了这三种特殊覆盖之间的联系。最后,本文还研究了约简算法的简化,包括区分矩阵的降阶简化和信息族(区分矩阵与相关族的统称)的元素简化。本文首次将拓扑分离性引入到粗糙集理论中来刻画知识库的分类能力,并利用拓扑手段将不满足分离性的知识库转化为满足分离性的,从而实现对知识库区分矩阵的降阶简化。对于不满足分离性的覆盖信息系统,这种方法可以极大简化其约简过程。在此基础上,我们还设计了信息族元素的简化方法,进一步简化运算对象。对于具有NP难的约简算法而言,这两步简化可以极大地缩短约简时间,具有重要的实际意义。总之,本文针对现存七对主要的覆盖逼近算子提出了粒约简、信息系统属性约简和决策系统的相对属性约简的理论和算法,这是对覆盖广义粗糙集约简理论的一个全面而系统的研究。