基于MapReduce的ID3决策树分类算法研究

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:bluegini2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树算法是经典的分类挖掘算法之一,具有广泛的实际应用价值。经典的ID3决策树算法是内存驻留算法,只能处理小数据集,在面对海量数据集时显得无能为力。为此,对经典ID3决策树生成算法的可并行性进行了深入分析和研究,利用云计算的MapReduce编程技术,提出并实现面向海量数据的ID3决策树并行分类算法。实验结果表明该算法是有效可行的。
其他文献
我国学校体育以“健康第一”作为指导思想或核心理念是对国家宏观政策的呼应,但同时也暴露出诸多问题:1)“健康第一”在学校体育中凸显,而其学校教育背景则相对被忽略;2)“健
视频会议系统是电力公司上情下达、生产协调、应急抢修等重要工作的保障系统之一,系统稳定运行关系企业管理和生产安全,可靠性要求很高。本文介绍视频会议系统的结构及工作原理
目前大量的协同过滤算法由于用户量过大存在速度瓶颈问题,由于新用户的加入导致冷启动问题.本文提出一种结合用户信任度和用户兴趣进行聚类的协同过滤算法.该算法综合用户信
目前对于查询相似度的计算通常是从比对检索结果与查询式的相似度来考虑。本文提出一种基于贝叶斯分类的算法来计算XML查询结果相似度。在计算出每个检索结果文档与查询式相
我场于1950—1957年用细毛公羊与本地蒙古母羊、西藏母羊进行杂交育种工作。在各代杂种羊(主要是三代羊)的基础上,利用杂交优势,采用横交固定、育成杂交的方法培育出适应高寒
期刊
为了实现教学质量网上评估的高效化、网络化、智能化,采用当前最流行的SSH(Struts+Spring+Hibernate)JavaEE框架结构,基于MVC模式的三层体系结构方法,开发了一个B/S结构的基于Web的教
程序切片技术大多是根据程序依赖图(PDG)和系统依赖图(SDG)的图可达性算法来优化得到感兴趣的程序集合,但是构造PDG和SDG需要很大的空间开销。本文提出一种基于逆向程序流和函数依
风云二号卫星在空间定位后,需计算出北京气象卫星地面站天线对卫星的方位、俯仰和极化角度。本文描述卫星与地面站的相对位置关系计算跟踪角度的原理,为了快速准确地找到卫星,可以利用天线运行角度规律仿真,建立天线跟踪模型,并把理论模型应用于卫星跟踪实践,应用螺旋扫描跟踪方法在工程实践中成功快速捕获风云二号新卫星。
高压静电除尘(ESP)电场中苛刻的工业应用需求对工业控制器的网络通信模块提出了较高的要求,控制器在必须具备较高的信号处理能力的同时,也要满足网络通信的实时性和开放性要求。
整流型、冲击性等非线性负荷在电力推进船舶中的使用十分普遍,这些非线性负荷的存在,导致电能出现畸变、波动、闪变和三相不平衡等质量问题,目前最严重的问题就是谐波。谐波能导