论文部分内容阅读
近年来,随着信息技术的高速发展与广泛应用,产生了海量的数据,如何从中挖掘潜在的、有价值的信息并将其应用到生产实践中变得尤为关键。由此,一种能够从大量的、不完整的、有噪声的、随机的数据中,分析并且智能提取信息的技术——数据挖掘应运而生,越来越受到人工智能领域的关注。数据分类是数据挖掘的一个重要内容,目前分类的方法很多,比如粗糙集理论、粒计算、决策树、人工神经网络等。粗糙集理论是一个处理不确定、不精确、不完备信息的数学工具,基于粗糙集的分类知识发现模型主要有:建模数据获取、数据预处理、属性约简、规则提取等。粒计算是问题求解、数据挖掘、信息处理的一种新的方法,覆盖了所有有关粒度的理论、方法和技术。粒计算已成为人工智能领域研究的热点方向之一。本文在粗糙集和粒计算理论基础上,针对不完备信息系统,对于决策信息系统的属性约简算法以及规则提取做了进一步研究,具体研究内容如下:(1)针对不完备信息系统,通过建立粗糙集扩展模型从而处理不完备信息的方法的研究已经比较丰富,然而,运用粒计算理论对于粗糙集扩展模型的研究领域还不成熟,本文利用粒计算理论对基于容差关系的扩充粗糙集模型进行粒的构造,并定义了知识的不确定性度量,即粒度熵与条件粒度熵,研究证明了相关定理和性质。并以条件粒度熵作为启发式信息,提出了基于条件粒度熵的属性约简算法。(2)经典的粗糙集方法对于不完备决策表进行规则提取时存在较多的不足,本文首先运用粒计算理论的思想,将不完备决策表分解并且对所分解的决策表进行等价划分得到等价类,而等价关系是不完备决策表中的空值与其它任何的值都不相同的。然后,给出规则的可信度作为规则提取的标准,继而提取出不完备系统中的确定规则。