机群操作系统中的高可用管理

来源 :中国科学院计算技术研究所 | 被引量 : 1次 | 上传用户:bluedogdog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机群系统的优点是可扩展性好,但随着机群系统规模的增大,节点数目的增多,机群系统整体的可靠性会相应降低。因此提高机群系统可用性的软件将成为机群操作系统中必不可少的部分。特别是故障恢复手段对大规模系统和长时间运行的应用显得尤为重要。另外,由于在机群操作系统中为每个子系统或子服务以及第三方应用独立维护自身高可用所带来的系统复杂性、系统运行时资源的浪费以开发维护过程中人员浪费与困难导致了机群操作系统中需要开发独立的高可用管理软件用以维护其它子系统或应用的高可用性。 曙光4000机群操作系统是一个集成的、一体化的机群中间件系统,高可用管理软件HA触发器是这个中间件系统的一个重要组成部分,我们称之为机群操作系统的一个重要“服务”。该服务是从原有的机群系统软件中抽取出来的可以共享的服务之一,它负责小规模应用和服务的高可用管理。HA触发器软件的设计采用了基于服务和一体化构件的思想,以基于CORBA的分布式构件方式实现,具有良好的可扩展性、高可用性和系统的包容性。 本文以提高机群系统中应用和服务的可用性为目的,以曙光4000机群操作系统为工程背景,探讨设计和实现机群操作系统中高可用管理软件过程中面临的关键问题及其解决方案。论文首先介绍的是课题背景、高可用研究目和高可用基本理论等相关内容。接着介绍了曙光4000机群操作系统的高可用性设计并提出了高可用管理在其中面临的关键问题。然后围绕这几个问题设计并实现了机群系统的高可用管理软件HA触发器。最后对高可用管理带来的应用和服务的可用性影响进行了量化建模分析。
其他文献
IXP1200作为一种网络处理器,它综合了RISC和AISC两大技术优势,既能像RISC软件编程,提供足够的灵活性来适应数据通信市场高速的发展,以缩短开发周期、提高开发效率;又具有ASIC的高
该文旨在研究实现一种通过简单的但具有代表性的网络拓扑结构和一些必要的设备及软件来现场向学生演示分组在网络传输过程中的分段和重组及路由的过程的工具,这会有利于加深
随着人们生活水平的提高,数字化、智能化的信息家居越来越成为人们追求的目标,而数字化的家庭安防是智能家居系统的重要组成部分。数字化的家庭安防必然要求实现对家庭视频的远
微地震通常是利用水力压裂或常规注水、注气等石油工程作业时引起地下应力场变化而产生,是分析油气储层分布走向的重要依据。微地震监测技术是通过对收集的微地震信号采用可视
随着社会的进步,电力行业的不断发展,电力系统监测平台的实时性与稳定运行对社会与经济的影响越来越大,这就对继电保护监测平台系统的性能与稳定性提出了更高的要求。而当今传统的继电保护监测平台软件系统框架是基于非对称式的双CPU平台,在这种框架当中,系统运行的方式是在一个DSP核心处理数据,另外一个ARM核心进行故障判断与通信,这种架构的缺陷在于单核串行处理数据模式会成为提高该系统数据处理速度的瓶颈,同时
互联网的出现及其发展扩展了人们的生活空间,影响了人们的生活习惯。网页越来越成为人们获取、发布、交换信息的平台。在1998年,W3C提出了可扩展标记语言(XML)。在可预见的将来
逼真性是虚拟现实的一个重要特性。本文在国家863课题“空间多点检测虚拟实时动态系统研究”软件部分工作的基础上,从虚拟环境的逼真性、虚拟人体的逼真性、人体运动的逼真性
IP语音业务迅速增长,得到了人们的极大关注,同时被认为是语音通信的发展趋势。它充分利用IP网和计算机的优点,为未来多媒体通信提供一个性能价格比最优的平台。但是由于IP网
该文在研究现有访问控制模型的基础上,针对传统的访问控制模型的缺陷问题,采用统一的形式化描述方法,提出了分别适用于三种不同环境的新的访问控制模型,即工作流访问控制模型
随着Internet和Web应用的迅速发展,XML正取代HTML成为Web数据发布、集成、仓储和交换的标准,XML的出现和广泛应用带来了Web技术的革命,也为电子商务的新型解决方案提供了重要