基于k-d树分区的聚类算法并行加速策略

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:como
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统K-Means算法存在准确率低、聚类速度慢的问题,从K-Means算法优化和Flink框架并行层面对K-Means算法优化。为避免算法陷入局部最优解,采用质心间最大距离原则选出k个质心;为提高大数据量下的K-Means聚类速度,提出用k-d树算法划分数据集实现操作算子并行化,设置多个TaskManager数目和CPU核数加速F-KMeans算法的执行。实验结果表明,较K-Means算法,F-KMeans算法的准确率提高了约3.6%;F-KMeans算法在DataSource耗时降低了45.45%,
其他文献
通过对农村信用社在县域金融竞争中的优劣势分析,提出了增强农村信用社实力的对策建议.
为合理设计筒装料管道水力输送技术,本文根据筒装料管道水力输送的水力特性,建立了筒装料管道水力输送数学模型,并采用FLOW-3D软件对该数学模型进行了数值求解,同时与试验结
在中国特色社会主义建设的新时代,我国文化产业发展呈现出一种新态势,文化产业的发展关系着我国文化产业市场发展的状况,为了更加明确我国文化产业的定位与发展问题,文章采用
傩面具艺术是傩文化中最具特征的符号.对于远古先民来说,傩面具是神灵.随着历史的进程,傩面具原有的鬼神崇拜、宗教迷信内涵逐渐淡化,转而开始注重体现民众的审美观念产审美
谈谈档案专业实习的管理中国人民大学档案学院研究生张斌笔者曾带队指导和组织过几次档案专业实习。现就实习的管理问题,谈谈一些做法和想法。一、加强思想政治工作,保证实习的
《所罗门之歌》(1977)是二十世纪美国杰出黑人女作家托尼·莫里森的一部优秀黑人小说,该作品的发表牢固地确立了莫里森在美国文学史中的地位。 传统的评论认为该部作品的主
<正> 一.概况: 新加坡是世界上最小的国家之一,面积只有618平方公里,人口300万。新加坡位于马来半岛南端,是太平洋与印度洋之间马六甲海峡的航道出入口,地理位置十分重要,这
贸易自由化推动者的英国和美国,在赶超时期使用保护和补贴方面却是最敢做敢为的。不幸的是,这种事实目前鲜为人知,主流经济学已经将其成功地从经济史、经济思想史中删除。本
笔者认为一件紫砂艺术品工艺质量优劣和艺术价值高低,取决于作者艺术修养的水平,操作的熟练程度及制作实践经验的丰富成份,特殊的作品必须用特殊的窑具来保证完好的烧成。
本文阐述了C72900铜合金的性能、用途及国内目前研究生产C72900的现状。对国内目前开发研制C72900铜合金所采用的真空熔炼技术、粉末冶金技术、快速凝固技术、机械合金化技术