论文部分内容阅读
粗糙集理论是由波兰数学家Pawlak Z.于1982年提出的一种数据分析工具。经典粗糙集理论以等价关系为基础,不具备处理对象的属性值为不确定信息时的有效机制。然而,实际问题中的信息往往具有不确定性,由于问题的复杂性和人类思维的多样性,对信息进行绝对精确或过于模糊的描述已经不能完全满足实际需求。区间粗糙数在刻画数据的不确定性时能够体现数据的不确定性中的一定的确定性,可以使决策者根据其风险偏好做出更符合实际需求的决策。而目前对属性值为区间粗糙数的粗糙集模型的研究还十分匮乏,基于相似关系的区间粗糙数粗糙集模型尚未见到有文献报道。
本文针对经典粗糙集在处理区间粗糙数信息系统时的局限性,以知识发现为目的,对相似关系下的区间粗糙数粗糙集进行了系统的研究,主要研究内容如下:
1.针对已有的区间相似度和区间粗糙数相似度的局限性,提出新的区间相似度和区间粗糙数相似度,并研究了它们的性质。
2.在区间粗糙数信息系统中,基于新提出的区间粗糙数相似度,首先提出了β-相似关系和相似类的概念,然后依次建立基于相似类、β-极大相容类和β-等价类的区间粗糙数粗糙集模型,并研究了这三种粗糙集模型的性质,最后探讨了这三种粗糙集模型的关系和其近似精度的大小关系。
3.考虑到基于相似关系对信息系统中的对象进行分类所得的分类结果通常是论域的一个覆盖,存在冗余。为了度量分类结果的冗余程度,提出了覆盖分类冗余度的概念,并对论域U基于相似类、β-极大相容类和β-等价类的覆盖分类冗余度的大小关系进行了论证。
4.在区间粗糙数信息系统中,新提出一种基于保持β-等价类不变的属性约简定义,并给出了基于区分矩阵的约简方法;同时在区间粗糙数决策信息系统中提出了一种保持相对正域不变的相对约简定义,并给出了对应的基于区分矩阵的约简方法。
5.基于β-等价关系,针对区间粗糙数决策信息系统给出了决策规则及其可信度的概念,同时说明了β-等价类的特征描述与经典等价类的特征描述的不同,然后通过一个例子具体说明了区间粗糙数决策信息系统的规则提取。
本文针对经典粗糙集在处理区间粗糙数信息系统时的局限性,以知识发现为目的,对相似关系下的区间粗糙数粗糙集进行了系统的研究,主要研究内容如下:
1.针对已有的区间相似度和区间粗糙数相似度的局限性,提出新的区间相似度和区间粗糙数相似度,并研究了它们的性质。
2.在区间粗糙数信息系统中,基于新提出的区间粗糙数相似度,首先提出了β-相似关系和相似类的概念,然后依次建立基于相似类、β-极大相容类和β-等价类的区间粗糙数粗糙集模型,并研究了这三种粗糙集模型的性质,最后探讨了这三种粗糙集模型的关系和其近似精度的大小关系。
3.考虑到基于相似关系对信息系统中的对象进行分类所得的分类结果通常是论域的一个覆盖,存在冗余。为了度量分类结果的冗余程度,提出了覆盖分类冗余度的概念,并对论域U基于相似类、β-极大相容类和β-等价类的覆盖分类冗余度的大小关系进行了论证。
4.在区间粗糙数信息系统中,新提出一种基于保持β-等价类不变的属性约简定义,并给出了基于区分矩阵的约简方法;同时在区间粗糙数决策信息系统中提出了一种保持相对正域不变的相对约简定义,并给出了对应的基于区分矩阵的约简方法。
5.基于β-等价关系,针对区间粗糙数决策信息系统给出了决策规则及其可信度的概念,同时说明了β-等价类的特征描述与经典等价类的特征描述的不同,然后通过一个例子具体说明了区间粗糙数决策信息系统的规则提取。