论文部分内容阅读
网络作为维系生产中心与灾备中心之间信息传输的重要桥梁,无论局域网(LAN)、城域网(MAN)还是广域网(WAN),其作用均无可替代。它将容灾系统架构组成元素关联在一起,其中任意一方的瓶颈均会对方案整体性能造成巨大影响。当传输距离较远时,WAN的带宽瓶颈超越了其它元素,跃升成为整个容灾方案性能上最大的限制因子。即使折衷采用LAN等本地备份方案,随着大数据、海量数据的爆发式发展,现有的传输效率也已渐渐无法满足数据量指数级的增涨。重复数据删除、压缩等技术能够利用容灾系统本身的时间、空间特性或删除重复数据或实现唯一块存储,可以有效优化存储和负载性能。隐马尔科夫模型能够根据可观察状态序列推测隐藏状态序列,从而建立有效的统计、预测模型。本文针对主流数据容灾恢复技术的缺陷和不足,在阅读国内外文献的基础之上,研究了上述优化技术的特点和应用,设计并实现了面向低带宽网络的数据容灾恢复系统。本文的主要工作总结如下:(1)研究及优化容灾恢复系统架构。其中,对容灾模式及数据存储方式作了深入研究,主要关注两个问题:如何优化架构层模块及其功能、如何保证数据安全。(2)设计并实现一个面向低带宽网络的数据容灾恢复系统InfoDr system,提出一种基于重复数据删除、压缩算法的工作流处理机制,可以实现工作流预处理、数据切分、指纹提取及碰撞检测等功能,并可有效优化生产中心网络负载。实验证明,InfoDr system所阐述的系统架构及其优化技术在实际生产环境中可有效优化工作流负载,且其性能仍能较好地满足业务系统需求。(3)通过观察分析InfoDr system QoS,利用包间隔模型估计可用带宽作为可观察值序列,对网络状态的隐藏值序列进行预测和估计,建立了面向低带宽网络的隐马尔可夫模型。实验证明,InfoDr system可保证多应用系统可用性,减轻网络拥塞。(4)对在研究与开发InfoDr system上所做的主要工作及其优势进行了总结,并提出了对InfoDr system未来工作的几点展望。