论文部分内容阅读
粗糙集(Rough Sets)理论是由Pawlak教授于20世纪80年代初提出的一种用于处理不确定性和含糊性知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。它无需提供相关数据集合外的任何先验信息,适合于发现数据中隐含的、潜在有用的规律,即知识,找出其内部数据的关联关系和特征。 本文介绍了经典(Pawlak型)粗糙集的基本理论及其推广模型。经典粗糙集是建立在等价关系基础之上的,用一对上下近似集合来表示一个不精确的概念。研究了粗糙集理论的属性约简问题,已经证明求所有约简和最小约简是NP-Hard问题,而寻求属性约简的启发式算法是解决问题的一种有效途径。证明了在属性约简过程中决策属性相对于条件属性集的条件信息量的变化规律是单调递减的,并提出了一种基于信息量的启发式属性约简算法,通过实例分析,表明该算法是有效的。