基于C4.5决策树分类算法的改进与应用

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:loveaudio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树算法是在已知具有不同特征的样本数据出现的概率基础上,构建决策树来进行数据分析的一种算法。在数据分类算法中,决策树算法是一种经典的分类决策算法。首先,将所有的数据特征看作是各个树的节点,遍历所有特征,其中每当遍历到其中某个特征时,对特征进行分割处理,并记录分割点的数据信息,作为划分子节点的纯度依据。其次,比较记录的数据特征以及判定最优特征,寻找最优划分方式,对样本数据集进行分割操作。最后,构建符合规则的决策树。针对传统的决策树C4.5算法计算信息增益率时间过长的问题,提出了一种改进的K-C4.5算法,
其他文献
将XML技术引入民航离港系统,用于在旅客办理离港手续时更灵活地打印旅客的登机牌和行李牌,方便旅客离港出行。具体方法是通过数据类型定义以及对登机牌数据流和行李牌数据流
青年干部是党和国家事业的新生力量,提升青年干部政治能力是新时代党的政治建设的重要内容和关键举措,是中华民族实现伟大复兴的基础,是党领导全国人民夺取新时代中国特色社
<正>环境的改变往往能够导致猪遗传背景发生变化,而这种变化常常给育种实践带来难以预料的后果,比如在一种环境下排序较为靠前的猪,到了另一种环境下,表现反而较差。为了探讨
针对当前公路桥梁梁养护管理工作的迫切需要,开展了在桥梁损伤评价与处治对策中应用和开发专家系统的新尝试,就构成该专家系统知识库和推进机制的需要,提出了公路桥梁损伤的评价
文章首次将特殊结构的永磁直线发电机的应用扩展到石油提炼管加热领域。详细阐述了石油提炼管加热用永磁直线发电机的结构和工作原理。并且基于电磁场有限元分析软件Maxwell
随着道路里程不断增加,机动车辆成为了主要的交通方式。为了满足机动车更好的行驶和道路的最大化利用,首先运用现阶段的车联网大数据等高科技来获取交通流数据,对错误的数据
针对传统手势控制系统制作成本高和对光线依赖性强等问题,设计了一种基于RFID无源标签的智能开关控制系统。系统以RFID技术与蓝牙mesh技术为支撑,将手势识别技术与智能开关控制技术有机结合,首先通过提取用户所佩戴的RFID无源标签的运动轨迹,并在PC端中构建手势数据指令库,同时利用加窗处理来解决无源标签运动时反射信号的不连续性,提取标签运动时相位流中的波纹特征分段,继而利用动态时间规整(dynam
无轴承开关磁阻电机结合了磁轴承与开关磁阻电机的双重优点,在航空、高速等领域具有非常广阔的发展前景。该文简要地介绍了无轴承开关磁阻电机的工作原理及其数学模型,总结了近
2009年年初,在总统就职演讲中,奥巴马宣称,美国在迎接一个新的责任时代的到来。实际上,很多美国人也确实认为新时代到来了。但通过对密执安大学社会研究所最新发布的《美国全
分析增强钢筋网(扩张网)钢纤维砼的技术特性及在佛开高速公路九江大桥桥面铺装中的应用,并对施工方法作了说明。