【摘 要】
:
构建决策树分类器关键是选择分裂属性.通过分析信息增益和增益比率、Gini索引、基于Goodman-Kruskal关联索引这三种选择分裂属性的标准,提出了一种改进经典决策树分类器C4.5
论文部分内容阅读
构建决策树分类器关键是选择分裂属性.通过分析信息增益和增益比率、Gini索引、基于Goodman-Kruskal关联索引这三种选择分裂属性的标准,提出了一种改进经典决策树分类器C4.5算法的方法(竞争选择分裂属性的决策树分类模型),它综合三种选择分裂属性的标准,通过竞争机制选择最佳分裂属性.实验结果表明它在大多数情况下,使得不牺牲分类精确度而获得更小的决策树成为了可能.
其他文献
本文分析了NMET听力试题的题干、选项和题目难易度的设计,并以NMET2005听力试题为例加以说明。
This article analyzes the design of NMET listening questions, options a
目的观察国产血管紧张素1型受体拮抗剂厄贝沙坦抑制兔颈动脉球囊损伤后再狭窄(RS)的作用,探讨 RS 可能的机理。方法将48只大耳白兔随机分为实验7、14、28 d 组并各设对照组(
多糖的生物活性与其分子量有着直接关系,而膜分离技术正是利用其不同的孔径截留不同分子量物质的新型分离技术。通过高效凝胶渗透色谱(HPGPC)表征微滤(MF)、超滤(UF)和纳滤(N
Alzheimer病(AD)是老年人最常见的痴呆类型,为一种神经变性疾病。传统观点认为,AD和血管性痴呆不论在发病机制和还是治疗上都是两种完全不同的痴呆类型,但是近年来越来越多的
决策支持系统和数据挖掘技术的应用已深入到企业管理、金融、办公及日常生活等各个领域.使用原先决策支持系统中的传统方法已远远不能满足决策者的需要,从而出现许多新技术新
根据华东电网资源分布和区域电力市场状况,提出了"皖电东送"输电规划基本原则,结合"皖电东送"容量和电力流状况,提出了相应的输电系统方案,并对"十一五"期间安徽电网各主要断
在介绍消息传递接口标准(MPI)和分析并行程序设计方法的基础上,提出了在并行程序设计中需要进行算法级分析和程序级测试,以此来对影响具体的并行程序执行效率的因素进行分析,
本文分析了不同利益集团对美国政府对华贸易政策的不同诉求,探讨了利益集团因素对美中贸易摩擦的影响,并提出了积极的应对措施。
This article analyzes the different appe
文中介绍了一种在远程实时广播教学中的资源同步播放方案.该方案使用目前成熟的流媒体技术,配合流媒体脚本技术,可以实现静态教材切换以及动态教材播放,满足了教学的需要.同
目的:探讨钴、锡、锶对大鼠肝脏脂质过氧化作用的影响.方法:模拟人体内钴、锡、锶的浓度,配制一系列浓度,运用体外TBA比色法检测MDA的含量.结果:锡、锶在浓度为(0.1667~1.0)um