基于云计算的并行k-means算法研究

来源 :齐齐哈尔大学学报:自然科学版 | 被引量 : 0次 | 上传用户:ken142560
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统k-means聚类算法面对海量数据存在时间复杂度急剧增加的问题,结合云计算的优势,提出基于MapReduce编程框架来实现k-means聚类算法的并行化处理。Map函数完成每个样本记录到聚类中心的距离计算并标记其所属聚类类别,Reduce函数汇总中间结果并计算出新的聚类中心,供下一轮迭代使用。通过实验表明:基于MapReduce的并行化k-means聚类算法具有较好的加速比和良好的扩展性。
其他文献
[目的]探讨健择合并顺铂对复治的局部晚期复发或转移性恶性肿瘤的疗效和毒性反应. [方法 ]使用健择(1000mg/m2, iv,第 1、8、15天)加顺铂(50mg, iv, 第 15~ 17天)联合化疗两个
【正】 胡耀邦同志在十二大报告中指出,作为国家建设的战略重点之一的教育,要为全面开创社会主义新局面服务,必须大力普及初等教育,加强中等职业教育和高等教育,发展包括干部
<正>2008年,中国工商银行收购非洲最大商业银行—标准银行集团20%的股份,该项投资是中国银行业史上最大的单笔对外投资,也是南非最大的外国直接投资,被《银行家》评为"2008年
针对火电厂热工对象的变结构、变参数和时变等特点,不采用一般的单神经元自适应PID控制,而是在此基础上加以改进,采用基于单神经元的自适应逆控制方案.通过大量的在各种环境
以山楂(Crataegus pinnatifida)、冬瓜[Benincasa hispida(Thunb.)Cogn.]、荷(Nelumbo nucifera)叶为原料制作天然复合保健饮料,添加蔗糖、柠檬酸、CMC-Na、蜂蜜为辅料,通过单因素
主角写真 王续东 21世纪房车网(21RV)信息总监 生活理念:为梦想创造可能!生活素描:www.21RV.com是中国第一个专业房车RV与露营CAMP传播网站,成立于2002年。旨在推广房车RV与露营CAM
全文对2000年、2001年<肿瘤学杂志>刊出的学术性文章进行统计分析,以了解该刊的发展状况,载文及作者的分布情况.
数控机床的许多误差元素相互耦合、相互影响,单一的误差补偿可能会造成过补偿问题。在机床几何误差和热误差补偿的同时还必须考虑切削力和刀具磨损等引起的误差,并且建立各误