论文部分内容阅读
随着应用对持续服务能力的要求的不断提高和服务失效带来的社会损失的日趋严重,高可用系统及其解决方案逐渐被广泛使用到各个对服务可用性有较高要求的应用领域。当前的大部分高可用系统采用共享直连存储模式,存在所支持服务节点数量有限、底层无法支持系统可扩展、大规模资源的管理和部署复杂化、资源利用率较低等问题。服务部署系统采用网络存储模式,将计算资源与存储资源动态映射以构建服务系统,从底层支持了高可用系统中资源和服务的扩展,为高可用系统应用于包含大量资源与大量异构服务的大规模计算环境提供了基础支持。
本文提出了基于服务部署机制的高可用系统架构和虚拟化高可用服务节点运行模式。该架构利用服务部署机制对系统中的计算资源和存储资源分别进行可用性管理,消除了系统中的单一失效点,无需为服务设计特定的高可用系统架构。系统将可用性管理机制和映射管理机制相结合为服务虚拟出高可用服务节点,将可用性服务的管理和部署简单化。虚拟化高可用服务节点中支持失效切换的网络存储协议NVD的实现验证了该系统架构和节点运行模式的可行性,同时提供了比NBD网络存储协议高10%的读性能。
在前述系统架构和节点运行模式的基础上,本文进一步探索了将高可用系统应用到大规模计算环境中的计算资源分配问题。本文根据服务的可用性需求和运行模式对计算资源进行分配,提出了面向服务部署的可用性分配模型。在可用性分配算法方面,本文提出了最适合分配(BF)策略及四类分配算法,分别为最适合顺序分配算法、最适合逆序分配算法、最适合冗余优先顺序分配算法和最适合冗余优先逆序分配算法。与前两类算法相比,当可用资源无法很好地满足当前服务可用性需求时,后两类算法能够提供更优分配方案。仿真实验表明,在重惩罚实例中,与加入遗传算法机制的搜索算法相比,冗余优先分配算法能够在有限时间内获得更优解,其求解时间量级为十分之一秒,能够应用于大规模计算环境中的资源分配。
针对支持大规模计算资源的数据可靠性和服务性能的网络存储架构,本文提出并实现了支持存储服务功能切换的高可用存储服务集群,提供Active/Active和Active/Passive两类高可用工作模式。集群系统采用脏页网络缓存机制,利用冗余存储服务器备份写数据,在保证数据可靠性的同时提供了较高性能的存储服务。测试结果表明,采用千兆网络连接的脏页网络缓存机制在64个计算资源节点并发启动测试中所需时间与异步写模式相当,小于同步写模式所需时间的1/3。实验数据表明,在底层存储设备性能满足需求的前提下,高可用存储服务集群能够支持大规模计算资源的部署和运行。