论文部分内容阅读
粗糙集理论是处理不一致、不完备和不精确信息的一种数学工具,具有不需先验信息的特点和优势,能够直接对数据集进行推理和分析,从而发现其中潜在的知识信息和推论。决策表系统的属性约简是粗糙集理论中的一个核心研究内容。由于最优属性约简是NP难题,因此实际应用的大多数属性约简算法都只能根据启发式信息来求取决策表系统的最优或次优约简。二进制分辨矩阵是粗糙集理论中的一种重要的数据结构,能够较好地描述属性对样本的分类能力,因而在属性约简算法中得到了广泛应用。论文对基于二进制分辨矩阵的启发式属性约简算法进行了深入研究:
首先,论文对二进制分辨矩阵的特点及基于二进制分辨矩阵的属性重要性度量方式进行了深入讨论。
然后,基于二进制分辨矩阵,提出了“加权选择概率”概念。这一概念充分利用了矩阵“行”与“列”方向的信息来度量属性重要性,并将这两个方向的特征按加权求和的方式集成为一个概念,从而避免了在属性选择过程中需要对“行”与“列”两个方向的特征进行独立排序,有效减小了运算量。在此基础上,提出一种改进的属性约简算法ABWSP。更进一步,提出了“实际选择概率”概念,“实际选择概率”综合利用了二进制分辨矩阵的信息来度量属性重要性,体现了“先列后行”的策略,克服了“加权选择概率”对权重设置的依赖。在此基础上,提出一种新的属性约简算法ABRSP。仿真实验结果表明,两个改进算法都有效缩短了运行时间,提升了约简系统的性能。
最后,论文将改进后的属性约简算法应用到学生期末成绩的分析过程中,通过对成绩表进行一系列的处理得到一些具有实际意义的结论。这一结果从某种意义上再次验证了本文提出的属性约简算法的有效性。