论文部分内容阅读
随着信息时代高速发展,数据库存储量也已成爆炸式增长。为了能够从中筛选重要信息、寻找蕴含规律、满足社会各领域的发展需求,数据分类技术已成为数据挖掘的一个重要方法,并在众多领域中得到了广泛的应用。分类知识实际上就是用来反映同类事物的共同特征以及不同事物之间的差异性,即通过反映数据集合的典型特征的模型来对未知数据识别和分类的一个过程。粗糙集作为有效的数据分析技术,在没有任何先验知识的情况下,能够挖掘出重要的数据或者规则,并且形成的规则易于理解、操作。本文研究基于粗糙集理论的分类方法,重点研究了决策系统的属性约简和分类规则约简两个方面。属性约简是在保持知识分类能力不变的情况下来删除冗余属性,本文给出一种属性重要度的定义方法,该方法不仅考虑而且同时也以定义绝对核的算法为基础,在保持正域不变的情况下,通过比较属性重要度的大小来改进算法,此算法能够减少运算量,提高了计算效率。在分类规则方面,重新定义核值,结合属性重要度大小,给出了适合不一致决策表的分类规则约简方法。本文将基于粗糙集理论的分类方法应用到船舶耗油数据分析,仿真实验证明算法是有效的。