分布式多节点容错系统的设计与实现

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:ldpjk77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet应用的日益普及,尤其是在Internet上提供大量的商业服务和大规模信息处理,人们对计算机系统的处理能力和可用性都提出了更高的要求。为避免因故障导致的停机和服务的中断,就要尽可能的提高业务系统的稳定性和可用性。最常采用的高可用技术便是容错技术,其中最具代表性的是集群系统,它在提高服务可用性方面得到了业界越来越多的关注。基于以上出发点,本文首先对高可用、容错和集群的各种关键技术进行了深入的研究和探讨,并总结了当前集群系统普遍面临的问题。针对这些问题,利用实验室现有的软硬件资源,设计并实现了一个分布式多节点容错系统。该系统不仅具有二级容错能力,即提供对任务和计算节点的双重保护,还具有灵活的任务调度功能以及较好的负载均衡能力。系统采用分布式的松耦合体系结构来组织节点,具有良好的可扩展性。针对分布式构架存在的消息复杂度高等问题,本文构建了分组管理模式,不仅满足了系统的可扩展性,更大大减少了因节点间周期性发送消息带来的通信代价。针对任务调度的NP问题,本文设计了分布式任务调度模型及分布式协商调度算法,将大部分决策过程分布到各节点的调度模块执行,降低了算法的求解复杂度,提高了效率。同时,算法综合考虑多了多方面的性能指标,包括任务的最早执行时间、通信量、负载均衡和调度开销等,能够根据任务和系统运行的状态进行动态多目标调度,从而满足各方面的性能要求。在此基础上,设计了失效任务和故障节点的接管算法。通过任务调度算法对失效的任务进行合理的重新分配,即保证了系统整体性能,又满足了系统高可用性的要求。
其他文献
智能卡由于具有信息处理能力,且体积小,便于携带,在人类生活中得到了广泛使用,逐渐成为人类生活中不可或缺的一部分,它也加快人类生活的步伐,提高了人类生活的质量。随着第三
DTN网络经常处于分裂状态并有很大延时,因此传统的Ad Hoc网络路由协议不能适应DTN网络的数据传输。当前针对DTN网络的组播传输的研究和成果相对较少,而且协议研究也多采用网
本文所做工作的主要目的是提升软件生产具有模块化、时序化特性的软件生产领域的软件开发效率、软件开发质量、和资源重用率。让这些领域的软件生产方式由编写出一个软件系统
随着计算机技术的飞速发展,出现了许多对数据恢复具有很强时间约束的实时运用系统,比如电话交换应用、移动计算机应用、证券交易系统等。尽管当前国内外对数据恢复技术已经有
医学成像技术的发展促进了临床医学的进步,数字医学图像在辅助诊断、教学和生物医学研究领域发挥了日益增大的作用。与此同时,数字医学图像的数量也与日剧增,如何从这些海量
随着软件规模的不断扩大和软件工程复杂程度的不断提升,人们普遍采用配置管理相关策略对软件过程进行规范化管理。随着软件配置管理在软件企业中的普及,很多国内外商业组织也
交互技术是增强现实关键问题之一。人们往往希望像与周围事物互动一样与计算机中的信息进行交流。然而在现实世界中与虚拟信息的交互是非常困难的。本文研究并构建一个自然的
人群仿真技术在虚拟现实中的地位越来越高。在公共安全领域、环境工程、交通工程和社会学等的仿真研究中,人群行为模型的作用越来越突出;计算机游戏动画、电影制作、大型场地表
根据现代社会对事务处理高效、便捷的要求,传统纸质选举方式已经满足不了现代选举的需求,计算机技术飞速发展以及网络环境的完善,使得以计算机网络技术为基石的电子投票应运
在嵌入式领域中,嵌入式实时操作系统正得到越来越广泛的应用。由于8位单片机本身资源的限制,以前很少有在8位机上运行的操作系统,随着8位机功能和资源的增加,渐渐出现了不少