MapReduce环境下处理多类别不平衡数据的改进随机森林算法

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:tingyu263
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统MapReduce环境下的随机森林算法在处理多类别不平衡数据问题时仍然以全局最优点作为划分点,忽略了少数类对分类准确率的影响,文本提出了一种MapReduce环境下处理多类别不平衡数据的改进随机森林算法(MR-RF-SHDSE).该算法利用分层采样方法在各个类别中进行样本抽样,并以HDDT决策树作为基学习器以弱化数据偏置给分类准确率带来的影响,最后计算决策树的GMean值和不合度值,利用调和平均值作为衡量标准对决策树进行选择集成.通过实验证明,相比其他算法,MR-RF-SHDSE能够有效提高了对多
其他文献
对辽东本溪连山关、高家沟和营口后仙峪三个花岗岩样品进行了LA-ICPMS锆石U-Pb定年、微量元素以及全岩主量元素分析,计算了锆石饱和温度和Ti温度。连山关和高家沟花岗岩锆石U
概述了创新教育的内涵和内容,并论述了教师在创新教育过程中的积极作用.
针对夏季气温高、蒸腾快、离体的嫩枝易失水导致萎蔫死亡的特点,总结了生产上常用夏季扦插育苗的几个关键技术.
本文以发达国家美国、加拿大、日本为例,对发达国家环境审计的成功经验进行分析,总结了发达国家环境审计的成功经验的共性及差异,并通过对我国与发达国家环境审计的对比分析,