基于Hadoop平台的聚类K-means算法的研究

来源 :电脑与电信 | 被引量 : 0次 | 上传用户:yangqixun123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前数据规模不断增大,单机的数据挖掘运行效率低下的问题,本文采用Hadoop平台对聚类K-means算法进行研究以解决此类问题。首先对Hadoop平台的架构和搭建进行了详细描述;其次详细分析了K-means算法;最后给出了算法实现,并对算法进行了实验分析。
其他文献
以"双绞线及其制作"教学单元为例,介绍了以传统实训教学为基础,依托学院智慧教室教学环境和网络教学平台,设置课前、课中、课后三个环节开展信息化教学的模式。通过增加自主
随着人工智能、云计算、大数据、虚拟化等技术的发展和成熟,未来运营商网络架构和运维模式将因此发生巨大变革,尤其是人工智能基于大数据和深度学习算法,在网络运维上必然会
金边虎尾兰(Sansevieria trifasciata vat laurentii)为龙舌兰科虎尾兰属,是人们现代生活中一种必不可少的环保室内植物。有研究表明,金边虎尾兰可吸收室内80%以上多种有害气体,而
本文对移动智慧校园服务平台实现的关键技术进行研究。通过信息挖掘技术为师生提供个性化资讯服务,减少信息过载压力;利用移动通信技术为师生提供自动适配的推送信息;统一身
对集成运算放大器几种典型应用进行可编程控制技术的讨论,为工程人员提供了有益的参考,具有一定的实用价值.
在误差允许范围内,采用简易方法自行延长巷道中腰线,以减少施工影响.