论文部分内容阅读
随着“信息大爆炸”时代的到来,应对海量数据的存储和处理问题的云存储技术作为云计算的重要延伸被提出。由于云存储中的存储节点众多,必然会出现存储节点不可得的情况。为确保数据的高可靠性,云存储系统引入了信息冗余机制和节点修复机制。如何保证在修复失效节点时系统资源消耗尽可能少、数据可靠性尽可能高已成为本业界关注的重要问题。在之前的研究中,大部分是针对单节点失效情形,但在实际云存储环境中多节点失效的情况较为常见。本文研究基于干扰对齐的高效云存储多节点修复方法,主要研究内容和成果如下:首先,基于网络编码特点和多节点修复模型,利用网络信息流图中的最大流最小割定理分析,推导了云存储中节点的存储容量和修复带宽的理论下界,并证明了可达性。即当且仅当云存储中的节点修复问题所对应的信息流图中的最小割值足够大,则必定存在一个能解决其节点失效问题的网络编码方案。其次,利用存储容量和修复带宽的理论下界绘制出了存储容量与修复带宽之间的最优折衷曲线,并得出两个满足存储容量-修复带宽最优折衷曲线的极值点:以存储容量最优化为基础的最小存储再生码和以修复带宽最优化为基础的最小修复带宽再生码。进一步,对精确的极大距离可分(Maximum Distance Separable,MDS)码进行扩展,给出了一种满足最小修复带宽下界的,针对多个系统节点或冗余节点同时失效的多节点精确修复(Multi-node Exact Repair,MER)码。在同时修复多个失效节点时,不同失效节点的修复过程之间会相互干扰。因此,本文针对2k n,2k1d n1的情况,给出了一种基于干扰对齐的多节点精确修复方法——多节点最小存储精确再生(Multi-node Exact Minimum StorageRegenerating,MMSR)码。首先,利用基于干扰对齐的一般性节点修复模型,说明了干扰对齐技术在节点修复问题中的必要性。其次,给出了多节点最小存储精确再生码的一般性构造方案,并证明了多节点最小存储精确再生码满足MDS特性。进一步,给出了两种多节点修复过程:同步修复过程和异步修复过程。最后,为了验证多节点最小存储精确再生码的MDS特性和可行性,给出了一个参数集为n, k, d, r7,3,5,2的多节点最小存储精确再生码的数据重建方案。仿真分析结果表明多节点最小存储精确再生码在保证修复带宽和存储容量尽可能小的情况下,增加了数据可靠性。