基于MapReduce和Spark的大数据模糊K-means算法比较

来源 :河北大学学报:自然科学版 | 被引量 : 0次 | 上传用户：wht000a

【摘要】

：

从原理和实验2方面对基于MapReduce和Spark的大数据模糊K-均值算法进行分析比较,并对2种大数据开源平台的优缺点进行了总结.由于模糊K-均值算法是一种迭代算法,需要对部分数

【作者】

：

翟俊海田石张素芳王谟瀚宋丹丹

【机构】

：

河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室,中国气象局气象干部培训学院河北分院

【出处】

：

河北大学学报:自然科学版

【发表日期】

：

2020年4期

【关键词】

：

大数据机器学习聚类算法模糊聚类算法迭代算法 big datamachine learningclustering algorithmfuzzy clus

【基金项目】

：

河北省重点研发计划项目(19210310D),河北省自然科学基金资助项目(F2017201026),河北省研究生专业学位教学案例库建设项目(KCJSZ2018009),河北大学研究生创新项目(hbu2019ss077),河北大学工商学院第五批教育教学改革研究项目(JX201820)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

从原理和实验2方面对基于MapReduce和Spark的大数据模糊K-均值算法进行分析比较,并对2种大数据开源平台的优缺点进行了总结.由于模糊K-均值算法是一种迭代算法,需要对部分数据进行重复操作以得到最终聚类结果,因此主要从算法执行时间、同步次数、文件数目、容错性能、资源消耗这5方面进行比较,得出的结论对从事大数据研究的人员具有较高的参考价值.

其他文献

军事职业吸引力探析

军事职业作为一种特殊职业,社会性是其基本属性。为充分说明军事职业的重要地位和作用,基于军事职业的社会属性,明确军事职业吸引力的概念,研究分析军事职业吸引力的特点、功

期刊

军事职业吸引力社会环境

脓毒症与器官衰竭的新定义

美国胸科医师学院及危重病学会关于脓毒症、全身炎症反应综合征及多器官功能障碍的定义。1 感染(Infection):指微生物侵入及存在于机体并引起炎症反应。2 菌血症(Bacteremia)

期刊

脓毒症器官衰竭全身炎症反应综合征多器官功能障碍综合征多器官功能障碍综合症危重病学低血压幼稚粒细胞感染微生物

喉全切除术后咽皮瘘的治疗和相关因素分析

[目的]探讨喉全切除术后咽皮瘘的发生率、治疗效果和发生相关因素.[方法]回顾1990年至1995年于中山大学肿瘤防治中心住院治疗的107例行喉全切除术的患者,应用SPSS统计软件统

期刊

喉肿瘤咽皮瘘全喉切除术治疗laryngeal neoplasmspharyngocutaneous fistulatotal laryngectomyt

糖耐量减低者尿中β2-微球蛋白、α1-微球蛋白、转铁蛋白和微量白蛋白的变化

目的研究糖耐量减低(IGT)者尿中微量蛋白的改变,监测IGT的进展和预防糖尿病(DM)的发生.方法采用速率散射比浊法检测尿β2-微球蛋白(β2-MG)、α1-微球蛋白(α1-MG)、转铁蛋白

期刊

糖耐量减低尿检Β2-微球蛋白Α1-微球蛋白铁蛋白微量白蛋白IGT糖尿病β2-microglobulin α1-microglobulin Tra

白洋淀不同区域荷叶品质和抗氧化性差异

为探究白洋淀不同区域荷叶品质和抗氧化性的差异,对白洋淀7个有代表性采样点的荷叶进行了研究.实验结果表明,白洋淀7个采样点荷叶的品质和抗氧化性差异明显:杨庄子和烧车淀采

期刊

白洋淀荷叶活性成分营养成分抗氧化性Baiyangdian Lakelotus leafactive ingredientsnutritional in

我相信那一件件白衣,能掠过风寒

期刊

综合医院放疗科的医疗质量管理

本文就综合医院放疗科的特点，对如何加强质量管理加以探讨：狠抓本科自身建设；建立一套科室的质量管理制度；密切与职能科室的联系，保证机器的质量，加强与临床科室合作，提高医疗质量水

期刊

综合医院放射科医疗质量医院管理

黄曲霉素和乙肝表面抗原暴露与肝癌有关

上海市肿瘤研究所所长高玉堂等研究证明,黄曲霉毒素暴露(即摄入被黄曲霉毒素污染的食物)与肝癌发生有直接联系,同时发现乙肝表面抗原暴露对肝癌发生有明显协同作用。人体肝癌

期刊

乙肝表面抗原黄曲霉毒素肝癌发生协同作用暴露密切联系上海市乙肝病毒流行病学肿瘤研究所

白洋淀轮虫群落结构及富营养化评价

于2018年5月(春)、8月(夏)和10月(秋)对白洋淀26个采样点轮虫物种组成和群落结构进行了系统调查,测定了水温(WT)、溶解氧(DO)、pH值、水深(WD)、透明度(Tr)、总氮(TN)、总磷(

期刊

白洋淀轮虫物种组成富营养化评价Baiyangdian Lakerotifersspecies diversityeutrophic state

新冠疫情下的就业形势及对策分析

突如其来的新冠肺炎疫情对经济发展和就业格局造成了前所未有的冲击。就业是最大民生,也是劳动者融入社会生活,实现自我价值,为家庭和后代带来幸福和希望的途径。就业稳、收

期刊

就业格局居民就业政策措施实现自我价值形势及对策融入社会基本民生疫情

基于MapReduce和Spark的大数据模糊K-means算法比较

与本文相关的学术论文