论文部分内容阅读
数据挖掘是近年来数据库领域中出现的一个新兴研究热点,也是提高管理决策支持能力的一种重要手段和工具。它的任务是从大量数据中提取隐含的、未知的、对决策有潜在价值的知识。
粗糙集理论在1982年由波兰科学家Z.Pawlak首次提出以来,经过二十多年的研究和发展,已经在理论上和实际应用中取得了长足的发展。粗糙集方法是一种处理不确定或模糊知识的重要工具,近年日益受到国际学术界的重视,已经在模式识别、机器学习、决策支持、过程控制等许多领域取得成功的应用。本文主要研究基于粗糙集属性约简的数据挖掘系统,文中对粗糙集理论进行研究,并分析了基于粗糙集理论的数据挖掘算法。
属性约简是粗糙集理论研究的主要内容之一。本文综合已有属性约简算法改进了一种基于熵的属性约简算法,并用产生的规则对对象进行分类。通过应用实例表明,该方法是可行的。
基于粗糙集理论的数据挖掘研究正处于起步阶段,数据挖掘本身及粗糙集理论研究还有许多问题值得探讨,论文将二者结合研究肯定还有很多不完善的地方,相关工作还有待于进一步的研究。