【摘 要】
:
针对以信息增益为划分标准的ID3算法中存在偏向属性取值多的属性等问题,提出了一种融合GINI指数的ID3改进算法。计算每个属性的信息增益和对应的GINI指数值,并计算所有属性的
【基金项目】
:
国家自然科学基金资助项目(61562045,61363042);江西省科技厅基金资助项目(20171ACE50021);江西省卫计委资助项目(2017A282)
论文部分内容阅读
针对以信息增益为划分标准的ID3算法中存在偏向属性取值多的属性等问题,提出了一种融合GINI指数的ID3改进算法。计算每个属性的信息增益和对应的GINI指数值,并计算所有属性的GINI指数算术平均值,筛选GINI指数低于算术平均值的属性记为候选属性集;从候选属性集中选择信息增益最大的属性建立分支,用递归方法构建决策树。实验使用6组UCI数据集进行验证。结果表明:该决策树的准确率均有所提高,对多值偏向问题有很好的克服作用。
其他文献
为保护生态环境,保证安全用水,需对水资源合理规划,使水资源能够得到充分利用,因此只有提升水文水资源建设项目管理水平,文章就对在水文水资源建设项目中的问题进行分析,提出
目的探讨单侧入路显微手术治疗双侧额叶脑挫裂伤的临床疗效。方法选取2017年6月至2019年1月我院新诊断双侧额叶脑挫裂伤患者60例,按随机数字表法分为观察组和对照组,每组30例
狭义理解踢(担子)、翻(摊位)、踩(菜篮)、拗(杆秤)、抢(物品)、打(小贩)。如果说用这6个高度概括的词来描述一种职业,一定会有人脱口而出:这说的不就是城管吗?"我就是城管。"2012年11月17日,
哲学社会科学学术话语权是一个国家软实力的表现。话语权的争夺,实质是意识形态领导权的争夺。西方国家总是凭借其在话语权中的优势地位,极力宣扬渗透西方国家价值观思想的"普
<正>不知从何时起,社会各界给"小升初(小学升初中)"起了个"小高考"的称号来形容其竞争的激烈程度。不过,"小高考"并不"小",甚至比"高考"有过之而无不及。在杭州一所民办中学,
随着人们对建筑环境质量认识的提高,建筑物理课程教学越来越受到各高校的关注和重视。文中通过分析传统建筑物理课程教学中存在的不足和当前数字技术在建筑设计中应用,指出了数
在本文研究中以现阶段我国16家商业银行为研究对象,对2010-2015年之间的财务数据为样本。通过多元线性回归等研究方法,重点分析了商业银行的经营绩效和资本结构之间的关系。在
在数学高考试题中经常出现一些比较新颖的问题情境,构造有一定深度和广度的数学问题,这就要求我们对新颖的信息、情境和设问,选择有效的方法和手段分析信息,综合与灵活地应用
文章介绍了染料敏化太阳能电池(DSSCs)的工作原理和过渡金属、非金属及稀土掺杂Ti02光阳极的研究进展.重点分析了过渡金属、非金属和稀土掺杂的Ti02光阳极对电子传输、界面电
中国陶瓷有着悠久而辉煌的历史,作为中国古代文化杰出的代表,它是世界各大博物馆的镇馆之宝,代表了人类在陶瓷文化和艺术领域的最高成就。在今天,中国陶瓷无论产业规模、品质