基于迭代填充的内存计算框架分区映射算法

来源 :计算机应用 | 被引量 : 5次 | 上传用户：fxily

【摘要】

：

针对内存计算框架Spark在作业Shuffle阶段一次分区产生的数据倾斜问题,提出一种内存计算框架的迭代填充分区映射算法(IFPM)。首先,分析Spark作业的执行机制,建立作业效率模型和分区映射模型,给出作业执行时间和分配倾斜度的定义,证明这些定义与作业执行效率的因果逻辑关系;然后,根据模型和定义求解,设计扩展式数据分区算法(EPA)和迭代式分区映射算法(IMA),在Map端建立一对多分区函数,

【作者】

：

卞琛于炯修位蓉英昌甜钱育蓉

【机构】

：

新疆大学信息科学与工程学院

【出处】

：

计算机应用

【发表日期】

：

2017年03期

【关键词】

：

内存计算数据均衡扩展式分区迭代式映射 in-memory computing load balance extendible partitioning

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

预见性护理预防经阴道分娩产妇产后出血的临床效果

目的探究经阴道分娩产妇运用预见性护理措施预防产后出血的预防效果。方法选取2015年5月~2016年10月我院收治的经阴道分娩产妇100例作为研究对象,采用随机分配法将其分为观察

期刊

预见性护理产后出血预防

基于迭代填充的内存计算框架分区映射算法

其他学术论文