论文部分内容阅读
粗糙集理论是一种能有效地分析和处理不精确、不一致、不完整等各种不确定性信息的数据分析工具。该方法近年日益受到国际学术界的重视,已经在模式识别、机器学习、决策支持、知识发现、故障诊断、预测建模等领域得到成功的应用。属性约简是粗糙集方法的核心问题之一,是粗糙集理论应用的关键技术,也是知识发现的重要研究课题,已成为一个备受关注的研究热点。有效、快速的属性约简算法是粗糙集理论应用的基础,也是粗糙集理论规模应用的保障。本文围绕粗糙集理论的一个核心问题即属性约简展开了三个方面的研究:信息表的属性约简、相容决策表即特殊信息表的属性约简、不相容决策表的属性约简。首先,在对区分能力大小研究的基础上建立了一个用于指导信息表的绝对属性约简的粗糙集模型,同时在对区分能力和分类能力二者关系深入研究的基础上提出了决策依赖区分精度新概念,该概念为用于指导决策表的相对属性约简的提供了一个新的判据,同时给出了区分精度、近似精度和决策依赖区分精度在属性约简过程中相互关系的研究结论,通过一组对比实验说明了决策依赖区分精度比近似精度对于分类能力的描述更细致客观。其次,借助粗糙属性向量树提出了新的求全部属性约简的算法,通过理论分析说明了新算法的时间复杂度低于经典的基于差别矩阵求全部属性约简算法以及它的改进算法。对比实验结果验证了本文算法在运算效率上明显高于基于差别矩阵求全部属性约简算法的改进算法。再次,Skowron的差别矩阵方法求不相容决策表属性约简会产生错误的结果,在一些文献中通过改进差别矩阵定义的方法来解决这个问题,并非十分理想,因为每生成一个差别矩阵元素前都要对两个相关对象的相容性进行判断增加了计算量,本文提出了新的解决办法,即提出了将不相容决策表转换为相容决策表的方法。最后,本文提出了新的简化差别矩阵算法,该算法是采用桶排序的思想构造属性桶,而后借助这个属性桶在无需排序的情况下边生成差别矩阵元素边简化差别矩阵,有效的加快了简化差别矩阵的速度并且最终得到有序的简化差别矩阵;同时,给出从属性所在差别矩阵元素的权重和属性在差别矩阵中的出现的频数以及属性的吸收能力三方面度量属性重要性的新标准,从而在新的属性重要性的度量标准和有序简化差别矩阵的基础上产生了新的求属性约简的方法,通过理论分析说明了新的求属性约简算法的最坏时间复杂度低于其它基于差别矩阵求属性约简算法。一组对比实验结果验证了本文的简化差别矩阵算法与同类简化差别矩阵的算法相比是高效的,另一组对比实验结果表明本文的属性约简算法可以很大程度上得到最小属性约简。