论文部分内容阅读
本文在了解和分析了国内外研究现状的基础上,针对不完备信息系统规则提取存在的一些问题,分别对目前存在的两种提取方法进行了研究和改进。第一种方法是将不完备信息系统转化成完备信息系统,再用完备信息系统的方法提取规则,在转化的过程中,遗失值填充算法的研究是要解决的关键问题。第二种方法是直接对不完备信息系统提取规则。
首先,本文提出了条件属性覆盖的概念。定义了不完备信息系统的确切覆盖和存在覆盖以及不完备信息系统的属性约简,在此基础上提出了一种先约简再填充的遗失值填充算法。算法先约简原始的不完备信息系统,再对约简后的信息系统填充遗失值,最后提取出不完备信息系统的规则。
其次,针对传统的决策树方法不能够有效地处理各种不完备信息的缺点,本文引入了不完备信息系统相对正域的概念。并在此基础上提出了每次选择相对正域模最大的条件属性作为决策树的结点,构造一棵单变量决策树的方法。
同时本文还引入了不完备信息系统相对泛化的定义,并根据相对泛化提出了一种多变量决策树的构造方法。