基于知识粗糙度度量的决策树构造方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:xiong100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘的一个重要研究分支,决策树模型是分类中最常用的一种方法,得到了广泛的研究和应用。然而,由于存在种类偏见和抗噪音差等问题,使决策树的优化成为关注的热点之一。本文基于粗糙集理论对决策树的构造方法和优化问题展开研究,主要工作如下:(1)综述并分析了决策树经典构造及优化方法。(2)以知识粗糙度作为决策树属性选择判据,提出决策树构造算法KRD,所构造的决策树的规模和分类精度比ID3有所提高。(3)提出一种混合变量决策树构造方法KRDH,根据知识粗糙度情况的不同,确定最佳的属性选择,以适应现实数据中噪音、属性相关性弱等问题。(4)为了提高决策树的抗噪性,提出基于统计模型的算法KRDlc,KRDlc算法在构造决策树的同时加上叶子生成控制参数,达到决策树的预剪枝,减少了噪音对属性选择的影响,避免了过拟合问题,同时减少了决策树的规模。
其他文献
在计算机技术发展过程中,仿真一直是一个重要的研究领域。指令集仿真器(ISS:Instruction Set Simulator)是在指令集体系结构的层次上对目标机进行模拟,ISS不仅有助于验证处理
随着万维网的飞速发展,XML的应用范围不断扩大,支持XML的数据库成为众人瞩目的焦点。关系型数据库不能很好地支持XML。关系型数据库将XML转换成二维表的形式存储,但XML与二维表
作为一个多学科交叉的领域,计算机视觉的理论研究和实际应用都取得了飞速的发展。尤其是近年来,图像科学的发展和计算机信息处理能力的增强,为计算机视觉的研究和应用提供了良好
目前,由于优盘的携带方便,传输速度快,连接灵活等优点,优盘已经成为一种倍受广大消费者青睐的数据存储设备。但是,普通优盘的数据是以明文形式进行存取的,缺乏必要的安全措施
本文在深入分析普适计算的特点以及普适计算的安全需求的基础上,结合目前针对网络资源的访问控制的热门技术——XACML技术,提出了一个基于XACML技术的普适计算下的访问控制模型
移动通信技术飞速发展,移动增值业务的出现不仅给移动运营商带来巨额经济利益,而且也在原来移动语音业务的基础上,丰富了移动网络的业务模式,同时也成为移动网络新的经济增长
近年来,本体技术应用于越来越多的领域。然而,本体在演变及融合过程中,极易出现信息冲突的问题,进而导致本体不协调现象的发生,因此,本体调试和修正工作受到了本体领域相关研
可扩展标记语言 XML (Extensible Markup Language) 是半结构数据的一种表现形式,它已经成为 Internet 以及电子商务中数据交换事实上的标准。对于传统的结构化数据可以采用关
名片包含了一个人的许多有用信息,其作为一种简明而美观的信息载体在现代商务活动中扮演着重要的角色。大量的名片给人们带来方便的同时也带来了日常管理的麻烦,很多手机和PDA
脑电现象是脑神经活动的外在表现形式之一,对脑电现象的研究,可使人们快速、无创和经济地阅读活体大脑的功能状态,如生理、病理、心理、感知、认知等。而达到此目的的关键是