基于粗糙集的数据分类知识发现方法及其应用研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:YWJJK
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代高速发展,数据库存储量也已成爆炸式增长。为了能够从中筛选重要信息、寻找蕴含规律、满足社会各领域的发展需求,数据分类技术已成为数据挖掘的一个重要方法,并在众多领域中得到了广泛的应用。分类知识实际上就是用来反映同类事物的共同特征以及不同事物之间的差异性,即通过反映数据集合的典型特征的模型来对未知数据识别和分类的一个过程。粗糙集作为有效的数据分析技术,在没有任何先验知识的情况下,能够挖掘出重要的数据或者规则,并且形成的规则易于理解、操作。本文研究基于粗糙集理论的分类方法,重点研究了决策系统的属性约简和分类规则约简两个方面。属性约简是在保持知识分类能力不变的情况下来删除冗余属性,本文给出一种属性重要度的定义方法,该方法不仅考虑而且同时也以定义绝对核的算法为基础,在保持正域不变的情况下,通过比较属性重要度的大小来改进算法,此算法能够减少运算量,提高了计算效率。在分类规则方面,重新定义核值,结合属性重要度大小,给出了适合不一致决策表的分类规则约简方法。本文将基于粗糙集理论的分类方法应用到船舶耗油数据分析,仿真实验证明算法是有效的。
其他文献
研究某类代数的结构,分类以及相关性质是一个比较基本的课题。为了更加细致的研究正规三角代数(简称为RTA代数)与量子群的关系等相关内容,在对正规三角代数(简称为RTA代数)及
分数次积分算子在函数空间中的有界性的研究是调和分析中十分活跃和热门的话题;同时交换子是刻画函数空间的一类重要算子。   本文首先探讨了分数次积分算子的交换子在Lebe
随着我国经济的迅猛发展,全国各地大兴土木。近几年来,房价不断上涨,土地资源日益珍贵。无论是民用建筑还是商业建筑都倾向小高层或是高层发展。为了顺应时代发展,上世纪九十年代
本文主要研究由仿射分形插值函数在矩形域上生成的一类分形插值曲面.介绍了这类分形插值曲面的构造方法.讨论了这类分形插值曲面的一些性质,特别讨论了它的变差性质.根据计盒
本文利用动力学的方法建立了两类具有垂直感染性的肺结核模型,主要研究的是潜伏类人群中的垂直感染情况.文章主要分为两种情况对此类模型进行分析:具有常数输入和总人口数变
混合整数规划在运输业、电力调度、天然气分配、石油混流等各个方面有着广泛的应用.研究表明,80%的工业问题都是混合整数规划问题,因此求解混合整数规划问题具有非常高的学术