基于检查点的MPI并行程序容错技术研究与实现

来源 :清华大学 | 被引量 : 0次 | 上传用户:xuelun2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
CHARM-NT系统采用"退出再加入"的方式设置检查点,其设置的检查点是可恢复、可迁移的一致性检查点;在设置检查点完毕后,重新加入采用了指定逻辑结点号的方法,使得程序在检查点设置前后的逻辑关系一致性得到了保证,从而保证了检查点设置不影响程序的正常执行.CHARM-NT使用了Winckpt作为单进程检查点设置工具.OLFT系统采用在线检查点的方法设置检查点,其设置的检查点不是全局一致性检查点,需要和卷回协议一起完成正确的卷回恢复和进程迁移;在设置检查点后,程序自然继续执行,丝毫不受检查点设置的影响.OLFT使用改良的Libckpt作为单进程检查点设置工具.VFO是该文提出的一种新的文件检查点设置方式,它通过包裹所有文件操作,使用虚拟文件管理器处理所有的I/O操作,使得任何两个检查点之间的文件操作原子化.
其他文献
在该文中,对机群文件系统的分布式命名机制、文件迁移机制和全局缓存方法等领域进行了研究,取得了有价值的研究结果.作者将其中一些成果应用于一个机群系统上的文件系统的设
产品数据管理(PDM)系统是以网络和数据库为基础、介于系统支撑软件和应用软件之间的一种框架性软件系统,以此系统为框架,可以建立产品开发的支撑平台。 本文首先对虚拟产品开
随着Internet的高速发展和多媒体通讯时代的到来,作为国际标准的MPEG无疑会成为本世纪多媒体通讯所依托的重要技术。但是,由于现在的Internet上延迟和丢包现象随时在变化,对于视
该文提出了一种应用层的基于Middleware的QoS管理模型,研究端系统的QoS和资源管理.该框架允许用户和应用对QoS管理策略和适应性调整策略进行应用级的定制.该文结合微观经济学
该文首先介绍了有关Linux上国际化的背景知识.然后介绍了在Linux系统上开发遵循XIM协议的输入法的必要性和有关输入法的基本知识,包括输入上下文、获取输入信息和输入焦点管
顾客服务支持系统是企业售后服务领域内的一类信息处理应用软件系统。它的主要用途是强化企业售后服务的信息化,通过客户查询在各个对应者上的分配,更加有效地利用企业售后服务
该文利用现有的语义资源——《同义词词林》和《知网》,构建了一个新的、更完善的语义资源.通过考察这两个资源的结构发现,对于《同义词词林》来说,它的缺点是缺少语义定义,
目前在中国的航天、航空、国际等重要领域使用的计算机系统一般都为自行研制,而且大多为高可靠的容错计算机系统.故障注入技术作为一种容错计算机可靠性测评的重要方法,能够
该网络课件制作系统是从底层开发的一种专门应用于制作网络课件的工具软件.它力求按照用户的操作习惯安排操作界面,尽量简化所需的操作环节.目前,该系统已经解决了制作课件中
该文着重讨论了松散耦合的分布式信息系统中的数据挖掘问题.对于信息标准化,文中采用XML作为松散耦合的分布式信息系统各自治系统之间的中介,将可能的信息和数据挖掘结果都采