BC-BSP系统中容错与动态负载均衡机制研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:antoney
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图是计算机科学中最常用的一类抽象数据结构,特别适合表达现实世界中各种复杂的关系。在图数据挖掘领域中,有很多算法需要多次迭代才能得到最终结果。针对这一需求,基于BSP模型的大规模图处理系统应运而生。现有的基于BSP模型的大数据处理平台中,Prege1、Giraph和Hama等系统虽然都能很好地处理大规模图数据,然而各平台在集群环境下都可能由于不稳定因素导致系统出现故障,而且它们的容错机制也不尽相同,很难得出高效统一的方案。另外,这些系统由于采用Master/Slave架构,将不可避免地会出现Master单点故障,而这些系统很少能够提出有效的解决方案。而且,这些系统还可能出现由于计算节点硬件问题或节点负载不均衡而导致的作业的“水桶效应”问题。因此,全面并规范实现基于BSP模型的大规模图处理系统的容错机制以及有效实现动态负载均衡机制是课题研究的重点和难点问题。针对上述问题,本文设计并实现了基于BC-BSP系统的容错和动态负载均衡机制。本文的主要贡献如下:第一,对于BC-BSP系统的容错机制,本文提出了异常处理模型。该异常处理模型对系统可能出现的异常制定了完善的侦测方案,同时,通过对异常进行规范编码可以结合相应的异常处理机制有效地处理系统中的各种异常;第二,本文还为BSPController节点提供了HA机制以解决BSPController节点单点故障的问题。本文实现的BSPController HA机制通过采用热备的方案实现,并将BSPController备份信息存储在HDFS上以便保持主备节点的信息同步。通过Zookeeper服务,BSPController HA机制有效地实现了BSPController节点故障侦测和主备节点自动切换;第三,本文设计并实现了动态负载均衡机制。通过收集任务的相关决策信息并按照本文设计的选择方案可以正确选择短板任务,然后根据相应的迁移策略实现短板任务迁移。通过该机制可以有效实现短板任务迁移并改变节点负载,从而提高作业的运行效率。经过实际部署和测试,基于BC-BSP系统的容错机制和动态负载均衡机制取得了预期的效果。通过BSPController HA机制,可以实现在BSPController故障后及时侦测并自动切换,然后快速恢复作业运行状态。同时,动态负载均衡机制也提高了作业的运行效率,解决了作业由于节点硬件问题或节点负载不均衡而产生的“水桶效应”问题。
其他文献
随着信息技术的蓬勃发展,WEB上的信息资源也呈指数级的飞速膨胀。然而在目前的万维网中,绝大部分有效的信息都只能由人工来理解,用户越来越难从海量的数据中查找自己需要的资源
随着Internet的发展,传统的C/S模式已不能满足新业务(如实时业务和多媒体内容分发等)的需求。主要原因是C/S模式在信息资源共享方面,会导致中心失效和硬件资源不能充分利用。为
为了能够快速构建车载信息娱乐系统,越来越多的汽车制造商希望将HTML5技术应用到车载领域。虽然HTML5以开发周期短的优点成为了快速构建车载信息娱乐系统的优秀解决方案,但是目
以软交换为核心的下一代网络的各项技术的逐步成熟,分组业务迅速发展,占据了越来越多的市场份额。然而传统的IP网络是基于“尽力而为”的服务机制的,缺乏有效的流量工程管理,不能
由于网格技术广泛的应用前景,网格安全正受到越来越多的关注。认证和访问控制作为网格安全的两大主要问题,引起了国内外很多政府、科研机构以及一些大型公司的重视。 本文首
近年来,国内乃至国际频频发生各种灾害,这些灾害不仅对受灾群众,甚至对于救援人员都会造成较为严重的创伤后心理应激障碍,这无疑会影响救援工作的开展与实施,如若不采取积极
随着电子商务和无纸化办公深入到各个领域,基于角色的访问控制方式得到广泛的应用,并形成了NIST RBAC标准。本文在NIST RBAC的基础上提出一种新的扩展模型,扩展模型依据客体和操
本文首先对网格计算进行了简单概述,包括网格技术的发展、网格定义、网格特性以及目前较为流行的网格体系结构。网格作为一种新模式的分布式计算基础架构,因其资源和服务的异构
随着越来越多的用户通过WWW来实现信息共享和查询,某些流行的站点可能因为访问用户过多而导致服务质量下降。为了增强服务的可用性和改善网络的流量分布,人们在网络中布置镜像
随着人们对移动性的追求,以3G技术和无线局域网技术为代表的无线网络获得了巨大的发展,无线网络的角色从有线网络的补充逐渐转变为有线网络的有力竞争者,给有线网络带来了巨大的