面向分布式关键任务系统的自律恢复机制研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:snoopy_cp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着技术的不断发展和应用需求的变化,人们对分布式关键任务系统的可用性要求越来越高,不仅希望系统能够保障关键业务数据信息的完整性,而且具有不间断运行或者即使失效发生也能在最短时间内自动恢复的能力。然而,由于系统功能种类和结构复杂性的不断增加,以及恶意攻击和软件缺陷等因素的存在,失效事件频繁发生,失效场景呈现出多样性和不可预测性的特点,使得对失效根源的追踪、分析和恢复变得异常困难,迫切需要系统具有自我检测、并能针对不同的失效场景智能化地进行恢复决策和实现自我恢复的能力。在这种背景下开展面向分布式关键任务系统自律恢复机制的研究,旨在将最近提出的自律计算技术与检测技术、恢复技术和决策方法相结合,通过合理的设计使系统在较少人为干预的情况下,具有自我恢复的能力,确保系统应用服务的可用性和连续性。目前,自律计算仍处于起步阶段,应用其解决分布式关键任务系统失效恢复问题的相关研究工作还比较缺乏,如何构建系统的自律恢复框架、如何对系统进行失效检测、恢复决策和恢复实现等诸多问题尚待研究和解决。基于上述情况,本文以提高系统自我恢复能力为目标,以应用服务的恢复为重点,以应用构件和运行环境的失效检测、决策及恢复方法为主线,对系统的自律恢复机制进行深入研究。首先,针对本文的研究目标并结合系统的特征需求,从自律计算的基本思想出发,构建一种面向系统自律恢复的框架模型DARA(DMCS Autonomic Recovery Architecture)。该框架模型依次分为知识层、管理层和目标层,在整体结构上形成一个“失效检测—恢复决策—恢复执行”的自律恢复控制环,在由系统实体模型、状态模型和恢复策略组成的恢复管理知识支持下,可有效地降低对系统恢复管理的复杂性,同时通过引入π演算完成对该模型的形式化描述和验证,证明了模型的合理性。其次,从检测方法和消息传递机制两个方面,开展面向系统自律恢复的失效检测问题研究。在检测方法上,为满足运行环境失效检测的准确性和对失效根源的定位需求,提出一种基于混合模式的检测方法A-Hybrid。该方法利用服务器模型、主机模型等信息来检测和定位失效对象;在消息传递方面,根据检测器与被检测对象间消息交互的松耦合需求,给出一种基于发布/订阅的检测消息传递机制。实验结果表明:A-Hybrid方法不仅能够以较高的准确度检测到失效对象,而且能够对失效根源进行定位,为下一步运行环境的恢复决策提供了可靠依据。再次,从应用构件和运行环境两个方面,进行面向系统自律恢复的决策方法研究。对于应用构件,针对其强关联性失效所带来的决策低效问题,给出一种基于重启树优化的恢复决策方法。该方法首先计算出构件间的失效关联度FRD,将关联度高的构件合并为一个重启群实现对重启树的优化,然后根据该重启树和检测结果给出可疑失效构件的恢复计划。应用结果表明,这种方法具有较高的决策效率,有利于应用构件的快速恢复。对于运行环境,根据其失效场景的多样性特点,提出一种基于智能规划的决策方法。运用环境中实体间的依赖关系进行领域描述,并根据检测结果和目标策略确定初始状态和目标状态,然后通过规划器生成恢复计划。实验结果表明,该方法能够对不同的失效场景智能地给出相应的恢复计划,为环境的恢复奠定了基础。最后,从应用构件和运行环境两个方面,开展系统失效恢复方法的研究。对于应用构件,以其短暂性失效恢复为重点,以系统应用服务的高可用性需求为目标,提出一种多粒度微重启的恢复方法。该方法通过将重启对象划分并包装为不同粒度的可重启元素,从而能够进行更为有效地重启恢复。实验结果表明,该方法同一般微重启方法相比,重启恢复时间可减少48%,使系统应用服务的可用性得到显著提高。对于运行环境,给出一种基于脚本的恢复方法,重点研究恢复计划与脚本的对应关系,并对运行环境在不同失效程度下恢复计划及其脚本的生成时间进行了实验研究,以便为具体关键任务系统的不同需求提供灵活的环境恢复方案。
其他文献
在信息检索和数据库应用中,一种常见的查询方式是从一组数据对象(如文档,图像)中返回符合条件的成对对象,例如,在数据库应用中经常需要根据相似度将两个相似的文档或者网页作
一个化妆品品牌要想保持持久的生命力,就要充分了解用户心理,最大限度地激发用户参与品牌的各种新零售营销之中。对于化妆品企业而言,想让自身产品赢得每一位消费者的钟爱是
在中国近现代史上,中华民族的独立无疑是中国共产党人的历史责任。在中国现代改革开放的进程中,实现中华民族伟大复兴的"中国梦"就成为了新时代中国共产党人的历史使命。中国
CAD等几何造型系统希望建模工具能用更少的数据量表示几何模型,这有利于节省计算时间,提高工作效率,加快网络传输速度。Bezier曲线曲面和B-样条是CAD/CAM系统中广泛使用的造
本文围绕王羲之的书法作品《兰亭序》墨宝及其文本,结合书家的个人经历及其所处的时代背景,分析作品所体现的书家的人格美及其所反映出的特定时代的精神风貌,探讨魏晋风度对
随着并行计算机的发展,特别是片上多处理器CMP(Chip MultiProcessor),又通称为多核处理器的出现,人们逐渐认识到并行计算加速应用的重要性,但是普及并行计算主要受到并行编程
在计算机辅助几何设计(Computer Aided Geometric Design, CAGD)中,曲线和曲面有两种基本的表示方法:参数形式与隐式形式。这两种表示方式在实际应用中有着各自的优缺点,例如:
网络技术是目前社会普遍用来提升工作效率的技术,通过网络化作用,可以有效打破时空的界限实现区域的协同化工作。目前,在网络技术的基础上,自组网络体系被广泛利用,这种自组
随着图形化用户界面GuI(Graphic user Interface)的广泛应用和计算机网络的迅速发展,实时的桌面图像序列传输技术正得到越来越广泛的关注,在网络多媒体会议、产品演示、远程
<正>诗歌被称为"语言艺术皇冠上的一颗明珠",诗歌语言的精妙构成了诗歌艺术的基石,因此对诗歌精妙语言的鉴赏应该是诗歌审美的关键。2016年《中学语文教学参考》编辑部组织的