【摘 要】
:
粗糙集理论是由波兰科学家Z.Pawlak在1982年提出的一种处理模糊和不确定知识的数学工具,已经成功应用于机器学习,模式识别,数据挖掘等领域。利用粗糙集理论进行数据挖掘,抽取
论文部分内容阅读
粗糙集理论是由波兰科学家Z.Pawlak在1982年提出的一种处理模糊和不确定知识的数学工具,已经成功应用于机器学习,模式识别,数据挖掘等领域。利用粗糙集理论进行数据挖掘,抽取知识规则,最重要的一点就是基于粗糙集的属性约简和规则提取算法的研究。通过约简的操作,降低属性的维数,提取出适合于决策支持的知识规则,是粗糙集理论的最重要应用之一。属性约简的求解是一个NP-Hard问题,导致该问题的主要原因是属性的组合爆炸。目前还不存在一种非常有效的方法,因此寻求快速的属性约简算法仍是粗糙集理论的研究热点之一。本文首先分析研究了基于条件信息熵的属性约简算法CEBARKCC,改进了CEBARKCC算法,减少了该算法中对属性重要度的不必要计算,提高了效率。接着利用粗糙集概率分布函数中的一些重要性质提出了一种新的属性约简算法,算法以属性全集出发,循环删除冗余属性直到不能删除为止,最终得到属性约简集。该算法避免了求取属性核和属性重要度的复杂度过程,简单明了,可用较少的计算时间求出约简,执行效率高于基于信息熵和基于辨识矩阵的属性约简算法。在规则提取方面,本文提出了一种基于粗糙集决策树的规则提取算法。算法以粗糙集中概率分布函数中可信度的定义,选取使生成规则的可信度大于等于用户输入的可信度阀值且支持度最大的属性作为结点,简化了生成的决策树,提高了决策树的泛化能力,有效地去除了噪音规则,提取的决策规则简洁有效。最后,本文用MATLAB工具实现了三种算法,并采用UCI机器学习数据库中的大量数据来验证算法的正确性和有效性。该课题受到福建省教委科技项目“基于灰色粗糙集理论的知识获取方法的研究”(Ja05290)资助。
其他文献
北京地区是中华文明的重要发源地之一。辽代以前,北京地区是中原王朝的军事重镇,文化教育发展相对落后。辽金以后,特别是元、明、清时期,北京逐渐成为全国的政治、文化中心,
"莫奈是以色写意的妙手",中央美术学院教授钟涵在《廊下巡礼》谈到莫奈时说,"有时淡彩渲染而略加点画,有时浓色皴擦而笔笔响亮,有时如乱针刺绣,有时如草书走笔、有时简练如齐
本文分析了信阳茶叶节的背景及其中节事营销的特点,并通过信阳茶叶节得到茶叶会展活动中节事营销的启示如下:打准定位;特色产业为支柱;加大宣传力度。
改革开放以来,我国实行了家庭联产承包责任制,农村经济飞速发展,在此期间,农村主要采取了按照人口或者劳动力平均分配的方式分配土地,一方面调动了农民的积极性,另一方面,也
本文重点研究了OFDM系统的PAPR问题,对现有的主要经典算法进行了详细地研究和MATLAB性能仿真分析。并在此基础上提出了两种新的降低系统的PAPR的算法。基于传统的预失真类限
在生产力相对发达的现代社会,民生问题已经不只是一个简单的物质需求问题,现代民生问题的核心是社会公平正义问题。宪法正义是最大的社会正义,要从根本上解决民生问题,必须在不断
农业的现代化需要社会化服务的支撑。随着中国经济的转型,第三产业在GDP中所占的比重越来越大,服务业与农业生产深度融合,各类新型农业经营主体加速成长,对农业生产社会化服
为提高村级土地利用规划中的公众参与程度,在明确公众参与村级土地利用规划的内涵及其必要性的基础上,采用系统论方法将村级土地利用规划公众参与系统分为三个子系统,即实体
城乡二元结构造成我国城乡发展失衡,引发“三农”问题。“三农”问题是我国全面建成小康社会进程中的掣肘之痛,解决好这一难题是实现中华民族伟大复兴进程中的重要环节。党的
中介语是第二语言学习者在第二语言学习过程中形成的一种特定语言系统,这种语言系统既不同于母语,也不同于所学习的目的语,而是一种随着学习的发展向目的语的正确形式逐渐靠