并行多处理器系统容错的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:pengpengice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,工业生产自动化的程度日益提高,自动化控制系统也日趋复杂。不但对控制系统的处理速度提出了更高的要求,而且要求系统也同时需要具有很高的安全可靠性以及及时准确性。这就要求控制系统在硬件上,特别是软件上既要保证系统的实时性,同时又能很快的处理系统中出现的错误。正是在这种前提下,并行技术与多处理器技术得到了广泛的应用,并且相互融合,产生了多处理器并行技术。容错(Fault-tolerance)技术即容忍故障,考虑故障一旦发生时能够自动检测出来并使系统能够自动恢复正常运行。当某些指定的硬件故障或软件错误发生时,系统仍能执行规定的一组程序,或者说程序不会因系统中的故障而中止或被修改,并且执行结果也不包含系统中故障所引起的差错。本文的主要内容就是阐明如何在并行多处理器系统中实现系统容错的具体方法。本文首先分析了并行多处理器系统容错所需要的多处理器技术、并行计算技术以及容错技术的理论。其次再结合所使用的系统,阐述并行多处理器系统容错的硬件基础以及具体的软件实现方法。本文的着重点是并行多处理器系统容错的软件实现。文章分别从系统的实时任务和后台任务两个方面阐明了实时容错以及自检容错两种容错方式的具体实现过程。实时容错主要是在系统的正常运行中,随时检测系统中CPU、总线及总线上IO设备、外围传感器、多CPU间通讯、输入输出数据等功能模块的工作状态。根据检测结果依次判断各个功能模块是否出现故障,甚至导致整个系统出现不稳定的状态,并随时将检测故障的数据告诉监控人员,由其决定系统是否需要继续工作。这些都是由根据并行多处理器系统的特点所决定的。自检容错是在系统维护时执行的任务,没有实时性的要求,一定要确保完成所需要的自检内容。程序主要检测各种硬件设备的工作状态是否正常,通过先将数据写到输出端口,再将从输入端口读回的反馈数据与预期结果进行比较的方法来判断各个设备的工作状态。自检完成后,将各个设备的故障记录告知维护人员,由维护人员根据具体的故障信息对系统硬件进行处理,更换故障设备,并决定系统是否可以投入到正常的工作中。
其他文献
网络考试系统是计算机辅助教学的一个重要应用,它的开发与研制一直是教育改革的重要方面。随着近年来计算机网络技术、通讯技术的崛起,网络考试发展迅速,在未来的远程教育中,网络
OLAP(On-LineAnalyticalProcessing,联机分析处理)是为了对存储在数据仓库中的数据进行分析处理的分析技术,它提供对多维数据的切片和切块、钻取、旋转等,便于使用者从不同角度
本文主要研究了视频点播流调度算法中的补丁流调度算法,在此基础上提出了分时分组周期补丁调度算法。该算法对现有的周期补丁算法进行了三点改进:⑴对每个周期内的补丁流按时
网络和通信技术的发展,使VoIP(Voice over Internet Protocol)成为以软交换为核心的NGN(Next Generation Network下一代网络)技术中的重点业务。它为电信业开发了更多的增值
在网络通信技术和传感器技术高速发展的今天,无线传感器网络已成为当前国际上备受关注的、由多学科高度交叉的新兴前沿研究热点,且广泛应用于军事、危险监控、环境预警、航天
当前造船技术的提高,航运事业的快速发展,迫切需要能够快速、准确进行故障诊断的智能系统。柴油机是船舶中的重要动力设备,在大多数情况下,由于其工作条件比较恶劣,发生故障的可能
FCoE协议将光纤通道帧封装到以太网数据包内,具有可靠、高吞吐量、无损传输等特性,让存储网络FC-SAN的数据可以通过以太网无损的传输,实现了网络的融合。本文介绍了基于自主研发
虚拟机I/O已成为虚拟化系统的性能瓶颈,虚拟机I/O性能优化可通过优化资源分配调度和完善体系结构这两个途径实现。  多核环境下虚拟CPU调度对于虚拟机I/O性能具有重要影响。
软件测试的目的是发现软件中潜在的错误。当软件测试达到充分的时候,测试工作就可以停止了,这就是软件测试充分性问题。它是从软件在有限多个测试数据上的行为判断软件在所有输
对等网络(Peer to Peer,P2P)的出现是对传统C/S网络架构的一次进化。由于P2P中的每个节点都能存储和共享数据,随着网络规模的扩展,基于P2P架构的系统所拥有的数据量迅速扩大,