基于RDD关键度的Spark检查点管理策略

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:zjubaoli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Spark默认容错机制由程序员设置检查点,并利用弹性分布式数据集(resilient distributed dataset, RDD)的血统(lineage)进行计算.在应用程序复杂度高、迭代次数多以及数据量较大时,恢复过程需要耗费大量的计算开销.同时,在执行恢复任务时,仅考虑数据本地性选择节点,并未考虑节点的计算能力,这都会导致恢复时间增加,无法最大化发挥集群的性能.因此,在建立Spark执行模型、检查点模型和RDD关键度模型的基础上,提出一种基于关键度的检查点管理(criticality check
其他文献
目的:原发性颅内淋巴瘤的MRI诊断及鉴别诊断效果评价。方法:选取2017年1月—2017年12月,12个月期间我院住院收治的患有原发性颅内淋巴瘤的患者50例,给予所有患者常规的临床药
构建了城市综合经济实力、城市基础设施建设、社会公共设施建设和城市资源环境建设共4个维度的综合评价指标体系,利用模糊聚类分析方法对我国15个副省级城市的城市综合竞争力
澳门既具有背靠强大祖国的政治经济优势,又具有与欧盟、葡语系国家、地区长期经贸往来,引进技术不受限制的有利条件及便于开展国际交流与合作的国际城市的优势,建议把握可以大有
以减速机产品为例,阐述了其选型平台开发的系统构成及功能,分析了利用Access创建数据库、VB.Net进行应用程序界面设计并通过编程实现前台应用程序和后台数据库的连接及运用So
Spark计算框架被越来越多的企业用作大数据分析的框架,由于通常部署在分布式和云环境中因此增加了该系统的复杂性,对Spark框架的性能进行监控并查找导致性能下降的作业向来是非
2017年底上映的迪士尼动画长片《寻梦环游记》刷爆微博、朋友圈,这部由皮克斯动画工作室制作的动画电影又成为了一部口碑之作,在豆瓣收获了9.1分的超强口碑。
随着科学技术的快速发展,现代科技馆作为其产物也必定要面临着自主创新与突破,而展品设计作为科技馆的关键,是以传播科学知识和培养科学兴趣为目的的。本文研究设计了太阳系模型
目的:观察超声引导下用0.25%罗哌卡因溶液做椎旁神经阻滞是否可以减轻开胸手术后的急性疼痛和慢性疼痛,及其与特耐、凯纷的镇痛效果的比较,并观察三种方法是否可以减少PCA的药物
我国水资源总量多,但地区分布不均。因而,伴随着工业化和城市化的进程,水资源紧缺成为制约某些地区经济发展的主要因素。广东省水资源量较为丰富,改革开放以来,随着经济快速发展,水
太阳能发电主要包括太阳能光伏发电和太阳能热发电。太阳能热发电系统主要包括塔式太阳能热发电系统、槽式太阳能热发电系统和碟式太阳能热发电系统,光伏发电的理论效率为24%,