基于消息数目检验和消息重排序理论的检查点算法的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:jhcjsc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大型分布式系统的不断发展,人们越来越关注系统的可靠性。例如中国研制的天河一号系统、航空火车等分布式控制交通系统以及基于MPI的FT-MPI系统等。分布式系统不仅关系到经济社会各方面的发展,而且与我们每个人息息相关。分布式系统容错性的质量保证的特性决定了其应用的广泛性以及重要性。分布式系统的容错性可以理解为容忍错误,消除错误影响。分布式系统容错主要分为前向容错和后向容错。考虑到存储量以及恢复过程,与前向容错技术相比,后向容错技术在实际应用中更为广泛。本课题来自于“基于后向恢复的异构分布式系统容错技术的研究与实现”的山东省自然科学基金项目。后向容错技术分为两种:基于检查点的容错算法与基于消息日志的容错协议。如何保存分布式系统的系统状态以及当系统失效时如何使进程恢复到全局一致状态是后向容错技术中的两个主要问题。现存文献中存在很多判定分布式全局状态一致的方法,但存在不同程度的缺陷。本文主要创新点及贡献为:(1)提出消息数目检验模型。通过研究进程间消息接收事件数目与消息发送事件数目的关系,本文提出消息数目检验模型。在此模型中,若一个全局状态中不含孤儿消息,则判定此全局状态是一致的。(2)基于消息数目检验模型,提出一种新的求解包含给定检查集的最大最小全局一致检查点算法。此算法首先利用消息数目检验方法判定给定的检查点集中是否存在孤儿消息。如果存在孤儿消息,则分布式系统中不存在包含给定检查点集的最大最小全局一致检查点,减少搜索时间开销。否则,通过全局搜索算法查找包含给定检查点集的最大最小全局一致检查点。(3)提出了消息重排序理论。首先此理论描述了消息发送事件与接收事件间的总是在先发生关系,并利用进程改进的逻辑时钟标记事件间的总是在先发生关系。其次此理论引入了等价消息接收序列的概念。在消息恢复过程中不存在和进程失效前执行结果完全一致的等价的消息接收序列。最后此理论解决了在乐观消息日志恢复协议中,进程的接收消息次序由于故障丢失的问题。(4)在消息数目检验模型和消息重排序理论的基础上,提出一种新的消息日志协议。此消息日志协议的主要创新点是:①此协议表明了在乐观消息日志协议中,系统故障恢复时未做日志的消息不可能以系统失效前的接收顺序准确重现。②使用基于接收的日志协议,消息做日志事件与消息发送事件可在消息发送方异步进行。
其他文献
随着互联网的迅速发展,网上聚集了海量的数据信息,人们淹没在信息海洋中,无法从中快速获取对自己有用的或者感兴趣的信息,出现了“信息过载”现象。推荐系统作为搜索引擎之后的一
作为信息安全的主要领域,图像加密算法一直是研究的热点。同时,作为多媒体的一种重要形式,图像越来越多地被应用于信息的交流中。因此,保证图像信息的安全,成为人们关注的焦
服务计算(Service Computing)是跨越计算机技术、信息技术、商业服务和商业管理等领域的新型计算学科。在服务计算环境中各代理之间是相互独立的,各代理通过构建信任关系实现
虚拟植物是利用计算机技术在三维空间内模拟植物结构以及生长发育过程的一门新兴学科,把人类对现实中真实植物的视觉等感官印象通过数学方法抽象为对植物形态学的一系列认识,便
近年来,在地图数据领域,如何管理海量的地理信息、提高信息的使用效率和搜索效率已经成为当前计算机界的热门课题。元数据管理系统是地理信息系统中进行信息整合的工具,如何设计
随着网络技术的发展,互联网的用户数量越来越多,传统的集中式的C/S网络模式因存在服务器单点失效和负载过大的问题面临着越来越多的问题和挑战,P2P网络作为一种新型的网络模式应
指纹识别技术,作为一种通过计算机实现的身份识别手段,是当今社会应用最为广泛的生物特征识别技术之一。在指纹样本的采集过程中,由于指纹可能存在干燥、划痕等因素影响,获取
聊天机器人是一个用来模拟人类对话或聊天的程序,它涉及数据挖掘领域的聚类、分类、答案推荐等多方面知识。在对话系统的知识库构建过程中,需结合特定业务场景,利用精准的领域知
随着因特网的飞速发展,网络通信成为人们交流的主要方式之一。因此,网络信息安全问题受到越来越多的关注。数字签名作为确保网络信息安全的核心技术之一,在理论研究和现实生活中
DTN(delay tolerant networks)网络涵盖了传感器网络、Ad-hoc网络和车载网络等,在军事、民用等方面具有广阔的应用前景。在一些特殊场景,例如部署在敌方控制区的军事自组织网络