【摘 要】
:
针对决策树C4.5算法在处理连续值属性过程中时间复杂度较高的问题,提出一种新的决策树构建方法:采用概率论中属性间的相关系数(Pearson),对数据集中的属性进行约简;结合属性
论文部分内容阅读
针对决策树C4.5算法在处理连续值属性过程中时间复杂度较高的问题,提出一种新的决策树构建方法:采用概率论中属性间的相关系数(Pearson),对数据集中的属性进行约简;结合属性的信息增益率,保留决策属性的最优子集,保证属性子集中没有冗余属性;采用边界点的判定,改进了连续值属性离散化过程中阈值分割方法,对信息增益率的计算进行修正。采用UCI数据库中的数据集,在Pycharm平台上进行一系列对比实验,结果表明:采用改进后C4.5决策树算法,决策树生成效率提高了约50%,准确率提升约2%,比较有效地解决了原C4
其他文献
俄罗斯别尔哥罗德国立研究型大学科研人员日前开发出新一代燃气涡轮发动机的独特合金,即高熵金属合金,这种合金具有超高强度和良好的延展性。现代燃气涡轮发动机必须具有很高
目的观察前路颈椎椎体次全切钛网植骨钢板内固定术治疗脊髓型颈椎病的疗效。方法回顾性分析2010年5月至2013年5月,对进行了颈前路次全切除,钛网骨植骨和内固定治疗的35例颈椎
中华人民共和国国务院中华人民共和国中央军事委员会令第269号现发布《国务院、中央军事委员会关于修改【中国人民解放军现役士兵服役条例】的决定》,自发布之日起施行。国务
<正> 五、智力的个别差异推孟根据905名(5到14岁)儿童的智商,得出一个实际次数分布,这一实际次数分布与理论的常态分布是吻合的,不仅推孟的结果是如此,其他研究者的结果也证
目的:探讨并分析导致重症监护室(ICU)的患者发生肠内营养相关性腹泻的因素。方法:选择2018年6月至2019年5月在苍南县第三人民医院ICU接受肠内营养支持的150例患者作为研究对
第九届全国人民代表大会第一次会议于1998年3月17日根据中华人民共和国主席江泽民的提名,决定朱镕基为中华人民共和国国务院总理。 现予公告。
阅读是高中语文学习的重要组成部分,如何优化高中生阅读,落实阅读教学是值得教师不断思考和探索的主题。高中语文新课程改革倡导培养学生的独立自主能力,推进学生合作探究学
歹徒和干警 某电台插播新闻。主播:“本台最新消息:我市发生一起恶性伤人事件,两名歹徒打伤我一百一十名干警.夺路而逃……”播完之后,主播自己也觉得纳闷:这歹徒也太嚣张了,居然打
出镜人物:李楠$$ 26岁以前,她是北京青年政治学院团委书记,她参与表演的群体舞在全国第十届群星奖舞蹈比赛中一举夺得金奖,在CCTV第一届舞蹈大赛中又摘得优秀奖奖牌。一场车
合玉27是由黑龙江省农业科学院佳木斯分院于2016年在黑龙江省审定(黑审玉2016035)的一个玉米新品种。在不同施肥方式的大田试验状态下,测定玉米新品种合玉27在各主要生育时期