云计算平台下具有断点恢复功能的自动化容错系统

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:pzgxsh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算在科学研究、缩减中小企业IT基础设施投入、优化资源利用率等方面发挥着日益重要的作用。随着人们对其计算能力需求的不断增加,云计算平台中节点的数量也越来越多。硬件技术的发展使得节点的可靠性得到了很大的提高,然而,即使单个节点发生故障的可能性很小,在拥有数十万甚至上百万个节点的云计算平台中,节点故障发生的频率会变大并严重影响云计算平台的可用性和可靠性。不仅如此,节点故障还会导致任务运行失败,从而造成严重的计算和存储等资源的浪费。为了解决云计算平台中节点故障频发所带来的这些问题,当前的主要方法是给平台增加容错功能。然而,目前已有的容错系统存在时间空间开销大、人工维护成本高、故障判断不准确等问题。因此,根据云计算平台对容错功能的实际需求,本文设计并实现了一个云计算平台下具有断点恢复功能的容错系统。主要研究内容包含以下四个方面:1、分析了节点故障频发给云计算平台所带来的各种影响,总结了容错系统所需要具备的功能模块,然后以平台资源监控为基础,从云计算平台整体架构、被动容错、主动容错三个方面设计并实现了一个高效实用的容错系统。该容错系统可以提高云计算平台的可用性和可靠性,能够解决单点故障、数据丢失、任务运行失败等问题,并且具有时间空间开销小、自动化程度高、易于部署实现等优势。2、提出了一种云计算平台中任务断点保存和恢复的方案,利用网络文件系统,该方案可以实现任务断点的可靠保存,在节点发生故障后任务能够自动的从断点处恢复。3、设计并实现的主动容错方案通过负载评估来预判节点的系统状态,当负载过高时,根据节点负载状况选择虚拟机进行在线迁移,可以避免节点故障所带来的影响并降低节点故障的发生频率。4、以Open Stack为基础实现了一个整体架构高可靠的云计算平台,并将容错系统中的被动容错、主动容错方案在此平台上进行实验和测试。实验结果表明,该容错系统可以自动的完成节点故障检测和恢复,断点恢复功能可以减少因节点故障所造成的计算资源浪费。
其他文献
目的:分析青海省妇女宫颈人乳头瘤病毒(HPV)感染情况及亚型分布。方法:采用医用核酸分子快速导流杂交基因芯片技术,对青海省26 622名临床就诊妇女宫颈脱落细胞标本进行HPV基
本文以课题作为切入点,运用定量和定性相结合的分析方法,试图通过对近10年来国家社科基金公布的课题指南及获批的资助项目的文献数量特征和变化规律的描述,探索我国社会保障
利用滚动磨损试验机研究了激光相变硬化处理前后轮轨钢试样的磨损与损伤性能。结果表明:激光相变硬化处理主要得到马氏体组织,显著提高轮轨试样的表面硬度,钢轨试样和车轮试
【目的】分析影响桃流胶病发生的关键因子,为其防治提供理论依据。【方法】2012~2014年,以广西油桃主栽品种中油5号为研究对象,对流胶病发病较重及发病较轻的两个典型产区的48个
当前针对社会主义核心价值观的学术研究聚焦以下几个问题:培育和弘扬社会主义核心价值观的意义;对社会主义核心价值观科学内涵的解读;如何在培育和践行社会主义核心价值观的
以就业为导向,探讨动态模块化教学在工商管理专业中的应用。结合工作实践,探讨构建工商管理专业“以就业为导向,以能力为本位”的动态模块化课程体系,并提出模块化课程体系的
本文对近年来国内外关于对新生儿病理性黄疸患儿进行治疗和护理的文献与资料予以回顾性地研究。从用药护理、光疗护理、换血护理、排便护理四个方面系统地阐述了对新生儿病理
川端康成作为日本新感觉派代表作家,其早期的作品“新感觉”特征即十分明显,川端康成的代表作、中期创作的中篇小说——《雪国》堪称其“感觉艺术”的经典之作。《雪国》是川端
翻译是信息传播的途径,尤其在文化全球化业已开始的今天。翻译传播是对一组告知性符号采取同一意向的双向传播模式,这就要求译者读者与原文读者的理解与反应相同或相似。以汪
北京商报讯(记者 肖玮 王胜男)马拉松赛事带热相关体育产业上下游的同时,也正成为一个旅游流量的入口。9月17日,2017北京马拉松在天安门广场起跑,来自33个国家和地区的3万名跑友前
报纸