【摘 要】
:
C4.5算法采用信息增益率来构造决策树,克服了选择较多值的属性的趋向,具有处理连续属性的能力。在处理大数据集时,表现出效率较低,忽略样本集中的不同样本与测试数据的距离差
论文部分内容阅读
C4.5算法采用信息增益率来构造决策树,克服了选择较多值的属性的趋向,具有处理连续属性的能力。在处理大数据集时,表现出效率较低,忽略样本集中的不同样本与测试数据的距离差异。该文提出了一种基于训练集局部加权的C4.5改进算法,根据欧式距离或汉明距离来定义样本的权值,将权值更新到训练集中,重新计算的信息增益率反映了训练样本的差异对测试数据的影响,并且在处理大数据集时,根据权值排序和设置的阈值简化数据集,降低了计算复杂度,提高效率。
其他文献
物质的东西有可能靠外力得到,唯有知识哲理只能靠自己毕生的学识素养、苦研、思索、体悟才能获取。 透过表象看本质,无形胜有形 表象和本质、有形与无形,是事物矛盾对立体的
多奈哌齐是一种可逆的乙酰胆碱酯酶抑制剂,可用于治疗各个阶段的(从轻度到重度)阿尔茨海默症,其显示有改善病人的精神状态和保持脑功能活性的作用。目前该药物的临床主要使用
当前高职教育以就业为导向,注重职业能力的培养。对于商务英语专业来说,翻译能力就是职业能力的核心。本文以商务英语翻译课程为例,研究其对职业能力的作用,以学生需求推动商务英
过氧化物-硫黄并用橡胶硫化体系BrodskyG.I.著曾泽新译涂学忠校与其它硫化体系相比,由硫黄和硫化促进剂组成的传统胶料硫化体系可提供良好的物理机械性能和成本的综合平衡。然而该体系也有
小学语文作为小学生学习的基础学科,对学生未来的发展有着不可忽视的重要作用,因此如何提高小学语文课堂教学质量,引起了社会的广泛关注,尤其是对于整体教育水平和条件相对落
智能手机科技的迅猛发展和移动互联网通讯催生的跨平台融合为微信6亿用户的爆发提供了有利的外部环境。利用微信公众平台强大的信息传播力打造高职院校校园文化品牌,丰富高职