论文部分内容阅读
粗糙集理论是波兰数学家Z.Pawlak于1982年提出的一种数据分析理论,能有效处理模糊和不确定性知识,并能发现隐含知识,揭示潜在规律。约简是数据挖掘的重要内容,也是粗糙集理论的核心问题之一。针对不同信息系统研究者提出了多种属性约简理论与算法。基于论域上的二元模糊关系,本文讨论区间信息系统和区间有序信息系统的属性约简方法。具体研究内容如下:1、从模糊信息论角度讨论了区间信息系统的模糊信息熵约简和区间决策表的模糊正域约简。首先,基于区间信息系统中对象间的相似度量在论域上定义了一个模糊相容关系,给出了决策类基于模糊相容关系的上、下近似。其次,通过引入模糊信息熵和模糊相对正域以及模糊近似质量,定义了区间信息系统和区间决策表中条件属性的重要度和相对重要度,并以此为基础,给出了一种计算区间信息系统的模糊信息熵约简和区间决策表的相对模糊正域约简的启发式算法。2、从优势模糊粗糙集的角度讨论了区间有序信息系统的模糊信息熵约简和区间有序决策表的模糊下近似分布约简。首先,详细分析了区间有序信息系统中对象间关于准则的赋值偏好关系的计算。其次,给出了区间有序信息系统的模糊信息熵约简方法。再次,基于决策类的向上并与向下并的模糊下近似,在区间有序决策表中定义了模糊下近似分布约简。通过引入条件属性的模糊重要度与模糊相对重要度,提出了一种计算模糊信息熵约简和模糊下近似分布约简的启发式算法,并用实例证明了算法的有效性。最后,给出了区间有序信息系统基于模糊粒的对象的排序方法。