基于Hadoop/MapReduce的K_NN算法

来源 :科技传播 | 被引量 : 0次 | 上传用户:ytvct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式框架Hadoop/MapReduce的逐渐流行,本文针对机器算法K最邻近算法,阐述其在Hadoop/MapReduce上的实现过程,其中对于文本的相似度会利用余弦定理还处理,这样在Hadoop/MapReduce环境下实现K-NN算法对位置类别的文本分类。机器算法在Hadoop/MapReduce上的实现,同时增加了算法的可扩展性和分析文本的能力,适应于当今大规模数据处理的要求。
其他文献
煤炭在我国能源结构中占有重要地位,煤矿安全是全国安全生产工作的重点。要防止矿难频发,就要重点改进设备和技术,杜绝安全隐患。同时加强员工安全培训,加强对员工的管理。
本文针对崇明北沿滩涂圈围工程的工程地质和水文地质特点,结合地形地貌、外动力现象,分析坝体滑移的内外因素,提出处理坝体滑移的处理方法,预测坝体后期稳定趋势,给滑坡处理提供了地质参考。
[摘要] 本文论述了创新素质的重要性,对工程训练中心在创新训练中如何培养学生的创新意识和综合素质培养所做的初步探索进行了总结。  [关键词] 工程训练;创新素质    1 引言    创新是一个民族的灵魂,是一个国家兴旺发达的不竭动力。一个国家的创新能力已经关乎国运的兴衰,正如江泽民总书记所说:“要迎接科学技术突飞猛进和知识经济迅速兴起的挑战,最主要的是坚持创新,创新的关键在人才,人才的成长
人性化管理是通过情感的双向交流和沟通实现有效的管理。其核心是激发人的积极情绪,消除人的消极情绪。为了真正促进幼儿园与教师、幼儿园与孩子、教师与孩子的同步协调发展,