论文部分内容阅读
Primary-Backups机制是设计容错计算机系统的重要方法,Primary-Backups机制的研究对于容错计算机系统的研制具有重要的理论和实践意义.该文系统性的研究如何把Primary-Backups机制应用到在容错服务器的设计中去.对有关的四个关键问题进行了深入研究:1.Primary-Backups机制的模型设计.根据前人的研究成果总结提出了Primary-Backups机制的模型,在模型的统一框架下设计Primary-Backups系统.2.容错服务器的模型建立和增强性设计:系统性的给出适合Primary-Backups机制的分析和设计的容错服务器的系统模型定义.在设计进程故障模型时用Fail-Arbitrary故障代替常用的Byzantine故障模型,不随意扩大故障模型.对于物理通信通道进行抽象提出了更接近于实际的一种模型对两种理论模型进行补充.为了简化Primary-Backups机制的设计,在容错服务器系统模型上设计了Fail-Silent进程;并在不完全可靠通讯模型的基础上,讨论各种通讯模型设计的策略,并给出一些不可能的理论结果.3.Primary-Backups机制关键算法DFD,DCC的研究:在总结前人工作的基础上提出了分布式故障诊断模型和分布式一致性控制的模型.根据分布式故障诊断模型着重讨论了设计针对PB系统的DFD算法的基本方法.然后通过对容错服务器系统模型的系统性的分析,从强到弱给出三个典型系统模型,分别对其上的PB-DCC算法设计进行讨论,设计出具有各自应用特点的PB-DCC算法.对于理想的PB系统设计了"同步"的PB-DCC算法,对于非理想PB系统"同步"的PB-DCC算法不具有实用性,把"Spooling"技术引入PB-DCC算法设计过程中,形成适合非理想PB系统"异步"的PB-DCC算法.4.在容错服务器的增强模型基础上,设计了PB-DFD算法和PB-DCC算法,并通过实验验证了算法的性能,然后在这两个算法的基础上进一步设计了其他两个重要的算法:C/S协同算法和分布式选举算法,并对这些算法分别进行分析和论证.从而完成容错服务器的Primary-Backups机制的设计.