论文部分内容阅读
随着数据资源的日益增加,人们迫切需要一类工具和方法,以便能够从迅速增长的数据资源中提取出有用的知识,从而帮助我们科学地进行各种决策。粗集理论提供了一种有效的方法。运用粗集理论中的差别函数对原有知识系统进行约简,去掉不重要的属性,以获取在最少属性集下具有同等分类或者表达能力的新信息系统,是粗集理论研究和应用的核心之一。而且约简也是求解最优规则的重要途径。 基于上述原因,本文着重研究了粗集的约简及其规则获取问题。 论文首先介绍了常见的约简和相对约简的方法,在此基础之上,提出及修改了一些相关定义,给出有关算法,并通过修改传统的差别函数为相似关系,及运用自定义的函数,不经复杂的逻辑化简,而是利用吸收律,在不生成分辨矩阵的情况下求出不完备信息系统约简集;通过分析差别函数的实质,修改了差别函数的定义,直接转换为用二进制表示的二进制位串的方法,通过“位与”操作,求解约简集等,并通过MATLAB证明了该方法的可行性。 接下来讨论了规则的表示问题:决策树的获取方法和IF-THEN规则表达法,新例对规则的学习等问题。最后介绍了粗集在知识发现领域的几个应用,由此进一步揭示了粗集理论的重要价值。