论文部分内容阅读
随着数据量级的不断增大,大数据挖掘算法提出了新的需求与挑战。针对数据聚类的K-Means算法做了一些研究,阐述了K-Means在大数据分析中的经典算法与R语言的实现,分析其存在的弊端引入基于Map-Reduce函数的K-means算法;进一步地,通过迭代方法实现了基于Map-Reduce函数的K-means优化算法,并用R程序得以实现;最后给出了程序的测试与应用,验证算法的可行性。