论文部分内容阅读
随着信息技术的发展,数字信息的存储、处理和传输成为信息系统不可缺少的重要组成部分,数据的可用性和完整性成为信息系统最重要的资源。然而灾难的发生是不可预测和无法控制的,它可能摧毁整个数据和计算基础设施,导致计算机中的信息的损坏或丢失。虽然传统的数据备份技术和服务器集群技术在一定程度上避免了由于各种软硬件故障、人为操作失误和病毒侵袭所造成的破坏,但随着网络数据流量的急剧增大,应用系统结构越来越复杂,数据安全防护的难度逐步增加。因此,为了适应发展的需要,必须依靠高性能的数据容灾技术,保证灾难发生时系统的正常工作。本文首先针对国内外相关领域文献进行了深入的分析和综述,总结了目前的容灾系统的优缺点,并就容灾系统中的关键技术以层次化的模式展开研究,论文主要进行了以下研究工作:在分析多种容灾系统模型的基础上,提出了一种基于层次模型的数据容灾方案,从网络体系结构的不同层次设计实现了多粒度的数据容灾技术,采用纠删码机制将存储数据进行分布存储,采用网络层数据流复制技术实现增量数据复制,采用面向应用层协议的悔改技术实现差异数据的复制。在一个循环备份周期内将上述方法进行融合,并通过形式化描述确定框架的性能指标,最后通过仿真实验验证了框架的可行性。在层次模型研究的基础上,本文首先研究了存储数据的全复制技术,采用数据冗余机制实现数据的分布式存储。通过对多种冗余码的分析,提出了一种适用于互连网应用的编码技术,即面向镜像机制的IRA码存储技术,将数据经过编码后分发到分布式存储系统中,该方法具有占用存储空间少、容灾效率高和数据完整等特点。数据全复制能够在一定程度上保障存储数据的安全,但是灾难发生后,那些没有来得及备份的数据将会丢失。因此本文提出一种基于网络层数据流的数据复制技术,对数据流进行实时的增量备份,解决从全备份点到发生错误时刻的数据丢失问题。本文提出了一种基于网络层数据流的容灾系统架构,并着重研究了数据流快速捕获及失效数据包过滤、支持快速检索的数据包有序存储技术和支持任意点的数据流回放关键技术。最后通过实验对系统的性能进行了测试,结果表明该方案对应用系统正常运行影响较小基于数据流复制技术由于采用实时的数据复制,占用存储空间较大。在数据流复制周期的中间,插入差异数据备份,能够解决占用存储空间大的问题。本文提出了一种面向应用层动作谓词的差异数据复制技术,这种复制方法针对全复制后发生的动作进行记录,数据恢复时只回放因应用层的动作而改变的数据,因此可以大大地节省存储空间,同时也改善了大流量下数据包丢失的情况。尽管这种方法依赖于应用层的具体协议,但是其融合动作与数据的悔改方式提高了系统的恢复能力。本文设计了实现基于4R模型的数据悔改技术,通过实验对比分析验证了系统的可行性。本文通过层次化的方法对数据容灾技术进行了详细的论述,实现了多种粒度的数据恢复技术,保证了存储数据安全性。本文的研究针对数据容灾领域的发展具有重要的研究意义和应用价值。