论文部分内容阅读
目前,越来越多的企业应用需要以24×7的方式运行,但不可预计的事件会造成数据丢失,严重地影响企业的可持续运营,给企业造成了巨大的损失。而实时的容灾系统可以满足企业的需求,它利用远程数据复制系统来减小或消除了数据的损失,并且利用备份的数据进行快速恢复。高效的远程数据复制系统已成为容灾系统的核心研究内容,但它的复杂性却没有得到相应的关注,对远程数据复制技术优化的研究少之又少,致使关键数据没有得到应有的保护。本文在研究和分析现有数据复制系统和相关技术的基础上,在Linux平台上设计并实现了异步远程逻辑卷复制系统ARVRL (Asynchronous Remote Volume Replicator for Linux),此系统优化了传统的异步复制技术。系统利用普通的IP网络来为本地卷设备提供一个远程的实时备份,既确保了容灾所需要的距离,也摆脱了对特殊网络设备的依赖;系统采用异步传输模式以减小对上层应用程序性能的影响,在复制过程中支持覆盖写以解决写冲突问题,减少了通信链路传输的数据量;系统独立于任何卷管理器,可以支持任何卷设备,其通用性好。本文对数据复制的相关技术进行了简单的讨论和研究,然后分析和讨论了ARVRL系统的整体功能和实现方法。主要工作可以概括为:(1)详细介绍数据复制技术的设计目标、实现策略和设计模式,并深入探讨了数据一致性维护的方法。(2)介绍了ARVRL系统的基本概念、系统结构、工作流程、状态机设计等。(3)依据写请求的数据处理流程,对整个复制过程进行了合理的划分,使得各个模块相对独立,减少各组件的耦合度。(4)在Linux平台上开发一个远程复制虚拟块设备,来截获主端上层应用程序的写请求,并进行相应的复制处理。(5)设计了提交单元的传播机制,在保证基于窗口的数据一致性的基础上,允许覆盖写,并设计动态调整合并周期大小的公式,以平衡网络负载的减少量和数据丢失量之间关系。最后,在现有的条件下对该系统进行了功能和性能测试,证实了本系统是一种通用性很强、经济的数据复制技术,系统的优化方案也有一定的理论参考价值。