【摘 要】
:
随着网络信息技术的不断发展,互联网已经渗透到各行各业,而且互联网用户数目也不断地在增长,这导致了互联网数据的爆发式增长,也为分布式计算提供了新的机遇。MapReduce是Goo
论文部分内容阅读
随着网络信息技术的不断发展,互联网已经渗透到各行各业,而且互联网用户数目也不断地在增长,这导致了互联网数据的爆发式增长,也为分布式计算提供了新的机遇。MapReduce是Google提出用于处理海量数据的分布式并行计算编程模型,它具有自动并行处理作业,可靠性高及编程简单等特点。Hadoop是基于MapReduce的开源分布式并行计算基础平台,由于定制和使用简单而被众多企业和科研单位用于海量数据的处理和研究。在Hadoop中分别采用HDFS(Hadoop Distributed File System)和MapReduce来存储和处理海量数据。在MapReduce框架中把硬件故障当作常态,因此容错机制是存储和计算健壮性和高效性的保障。推测执行是计算容错的重要手段,它通过找出执行异常慢的任务并将其备份任务放于另一个节点执行,以达到降低任务执行时间及节省集群资源的目的。现有的推测执行策略主要包括基于启发式的LATE(Longest Approximate Time to End)和基于集群成本效益的MCP(Maximum Cost Performance)。这两种策略的实现原理不相同,LATE比MCP实现起来更简单,但效果不如MCP。通过对LATE策略中存在的问题进行总结和分析,针对LATE策略中进行任务剩余时间评估没有考虑系统负载的影响而导致评估结果不准确的不足,提出了系统负载感知的启发式推测执行策略ERUL(Estimate Remain time Using Liner relationship)。ERUL扩展计算密集型任务执行时间同系统负载基本呈线性关系的结论用于任务剩余执行时间的评估,提高了评估的准确度。同时,ERUL还解决了LATE中不能处理Map任务输入倾斜,不能及时发现掉队任务及节点性能评价存在缺陷等问题。实验表明ERUL在任务剩余执行时间评估方面比LATE更精确,同时对集群性能的改善也比LATE更好。对MCP策略执行流程和存在的问题进行深入分析,提出了一种异构环境下的MapReduce推测执行改进策略exMCP(extensional MCP)。MCP模型在对集群资源价值进行计算时没有考虑异构环境下不同节点的Slot拥有不同的价值,因而会导致模型使用时产生差错。同时,MCP中没有对Map任务按照是否满足数据本地化进行分类,这可能导致不满足数据本地化的任务被全部认定为掉队任务等错误。在exMCP中通过考虑Slot价值来计算集群资源价值,同时对Map任务分类独立进行推测执行,另外还对选择备份任务执行节点存在的问题进行了改善。实验结果表明exMCP的推测执行成功率和对集群性能的改善都比MCP更好。
其他文献
随着世界经济的快速发展,人类社会对能源的需求不断提升,化石能源的大量使用一方面带来严重的环境污染问题,另一方面由于化石能源的不可再生性,使得世界面临能源枯竭的问题,能源危机成为横亘在人类发展史上的重要问题。在此背景下,发展可再生能源、持续不断地优化能源结构,是现阶段各个国家的重要能源政策。光伏产业作为清洁、可再生的能源形式,具有利用难度低、储量丰富等优点。新世纪以来,我国光伏技术迅猛发展,光伏电池
输电线路绝缘子的覆冰会降低绝缘子的电气性能进而可能引发闪络,甚至造成停电事故。绝缘子覆冰闪络过程通常要经过电晕放电,局部电弧的形成与发展,闪络这几个阶段。闪络现象
粤港澳大湾区作为新形势下国家提出有关经济发展的战略性举措,是我国开放程度最高、经济活力最强的区域之一。2019年2月《粤港澳大湾区发展规划纲要》政策的出台,将大湾区建设上升到国家战略地位,其共建人文湾区中指出,坚定文化自信,共同推进中华优秀传统文化传承发展,对民族传统体育发展具有指导作用。舞狮运动作为民族传统体育重要组成部分,是中华民族先民生活、生产、舞蹈、娱乐的民俗体育结晶,体现了中华民族传统体
本文是一篇基于2016年10月28日作者为中欧国际职业教育培训中心做的一次交替传译的实践报告。中欧国际职业教育培训中心位于武汉,是一家为国家商务部援外司做职业技术培训的
税负水平一直是各行各业非常关心的经济指标。从微观角度来看,税负会直接影响到企业创造剩余价值的积极性以及企业自身价值的评估判断。从宏观角度来看,行业税负水平也能反映出这个行业的发展潜力。国家为了调控电力企业税负,在2016年对电力企业实行了“营改增”税务制度,此举措在一定程度上切实有效地避免了企业重复征税,影响了企业现金流状况从而进一步影响到企业的经营成果,但是对经营成果的实际影响,目前在国内缺少一
堤坝水库是我国常见的水利设施,承担着对水力资源的调节功能,以及重要的防护作用,与国计民生紧密相连。在我国,主要以土石堤坝为主要类型,数量众多,分布广泛。土石堤坝的结构较为简单,堆填建造材料也相对单一,更容易受到温度、气候以及周边的地质活动等因素影响,从而发生结构上的变化,导致堤坝内部产生能够威胁到坝体稳定和安全的隐患,因此对堤坝隐患灾害的监测、探测显得尤为重要。随着国家对水利工程安全的不断重视,对
全球化经济背景下,移动互联网等颠覆性技术不断产生颠覆效应,改变了现有市场格局。颠覆性技术逐渐受各界关注,其中颠覆性技术的早期识别是学者关注的焦点和难点。互联网时代背景下,颠覆性技术形成过程的信息以不同形式呈现在不同媒介,形成多源异构数据。专利数据反映知识、技术、经济等信息;社交网络数据反映社会公众态度、认知和期望等。有效利用多源异构数据探索颠覆性技术特性,综合考虑颠覆性技术特性,实现颠覆性技术的早
随着我国经济社会的发展,人们生活水平和文化水平不断提高,对文化旅游的需求量越来越大,文化遗产的发展显得尤为重要。海龙屯土司遗址作为贵州省唯一的世界文化遗产,是贵州向其他省份甚至全世界展示的一张靓丽名片。其既具有特色的旅游资源,又有丰富的文化价值和发展文化旅游的基础条件,大力发展文化旅游是促进海龙屯土司遗址可持续发展的根本途径之一。本文以海龙屯土司遗址为例,通过查阅国内外文化旅游、遗址类文化遗产旅游
立足新时代我国农业发展现状,全面剖析农业高质量发展的内涵特征、现实价值,以国外发展经验为镜鉴,提出新时代我国农业高质量发展的总体框架、主要路径:新时代推进农业高质量
目的:本试验目的在于观察神经肌肉电刺激疗法在难治性面瘫(顽固性面瘫)治疗上的的临床疗效,并与传统穴位针刺手法做对比,探索神经肌肉电刺激对难治性面瘫是否具有提高临床疗效的作用,从而为难治性面瘫患者治疗提供更有效、便捷、经济的治疗方案。方法:严格按照纳入及排除标准,将60例难治性面瘫患者分为两组,神经肌肉电刺激组和传统穴位针刺手法组,每组各30人。神经肌肉电刺激组患者予XY-K-SISS-A型神经肌肉