【摘 要】
:
经典的分布式k-means聚类算法随机选取初始聚类中心,进行多次的迭代,容易使得聚类效率低,网络通信量大,而且聚类结果不稳定。针对这些问题,提出一种改进的分布式k-means聚类算法。
【基金项目】
:
广西自然科学基金资助项目(2013GXNSFAA253003)
论文部分内容阅读
经典的分布式k-means聚类算法随机选取初始聚类中心,进行多次的迭代,容易使得聚类效率低,网络通信量大,而且聚类结果不稳定。针对这些问题,提出一种改进的分布式k-means聚类算法。该算法通过划分数据集,计算属性最密集的k个数据块作为聚类中心,以确保聚类中心的代表性,进而减少算法的迭代计算次数,提高聚类效率。通过在Hadoop分布式平台上进行实验,结果表明改进算法能减少迭代次数和收敛时间。
其他文献
民国成立后至抗战前,在大学任教的留美归来的学者,秉承教育救国、科学救国的思想,积极创立新系科,编写新教材,组织科学学术团体等,对近代西方自然科学在中国的传播和创立做出
口语交际能力是现代人必须具备的能力之一。语文教学中结合学生实际,从激发兴趣入手,与听、说、读相结合,采取多种方法、多种途径培养学生口语交际能力,以鼓励促实践,不断提高学生
本文对物流企业运用作业成本管理的意义、框架和应注意的问题进行初步的探讨。
颈椎前路骨圈椎体植入融合术是治疗颈椎后纵韧带钙化、颈椎间盘突出的一种新技术。通过对42例患者手术前后的护理体会,认为:(1)重视木前宣教;(2)认真观察病情,做好术后护理;(3)术
在分析海底地貌学国内外研究现状基础之上,综述我国海底地貌的最新研究进展和发展历程,探讨今后我国近海地貌的研究发展方向:我国现代海底地貌学研究虽然起步较晚,但总的趋势
目的 :针对高级别生物安全实验室、传染病病房等生物安全设施围护结构管线穿墙密封的需要,研制一种用于污染废水排放的生物安全型密封地漏。方法:该密封地漏主要由上下贯通的筒
农村的改革、发展与稳定,从根本上说涉及三个基本问题:一是农业经济的改革、发展与稳定;二是农民生活的保障和改善;三是农村精神文明水平的提高.这三个方面是相互依赖、相辅
构建京津冀三地公共图书馆区域联盟是京津冀协同发展的要求,图书馆区域联盟的本质是知识协同。本文应用知识协同理论,在调查分析京津冀三地公共图书馆发展现状、图书馆区域联
社旗县饶良镇锁刘堂村村民刘书营做皮冻生意致富的事儿,在当地传为佳话。 1995年,刘书营到郑州打工,由于无技术,一月也挣不到几个钱。正当他在为欠账犯愁时,一家饭店墙壁上挂满的猪皮
为了解转基因大豆膳食纤维食用安全性,对其进行了食品安全性毒理学评价。采用小鼠急性经口毒性试验、小鼠骨髓微核实验、小鼠精子畸形试验和Ames试验进行检测。结果表明:雌雄小