论文部分内容阅读
作为一种数据安全策略,数据备份是保障数据安全的一种重要手段。然而现有的数据备份方案往往采用昂贵的数据备份服务器存储数据,这大大增加了备份的成本,同时也降低了系统性能。而计算机硬件的频繁更替,使得很多计算机设备成为了完好可用的闲置资源。云存储技术的出现,为这些闲置资源提供了用武之地,同时为数据备份提供了一种新的思路。在众多的云存储软件中,Hadoop分布式文件系统(HDFS)就是利用这些闲置资源来构建分布式集群,以解决数据存储和安全问题。本文分析了现有的主流备份方案,在研究对比的基础上,吸收已有备份方案的优点,弥补其不足,将云存储技术应用于数据备份,分析并设计了基于分布式文件系统HDFS的数据备份系统。该系统利用云存储技术,构建廉价、可扩展的分布式集群,解决了用户数据备份/恢复、邮件备份/恢复以及数据归档的需求,通过合并压缩、加密等技术进一步提高了系统的性能和安全性。本文主要进行了如下几方面的工作:1.介绍了数据备份系统的研究背景,总结了现有的备份系统及其优缺点。2.对数据备份以及HDFS的相关理论知识进行了综述。主要介绍了数据备份的概念、备份策略、备份系统分类以及逻辑结构,还介绍了云存储技术及HDFS的相关知识。3.对基于HDFS的数据备份系统进行了需求分析和详细设计。明确了备份系统的功能需求,完成了项目体系架构、功能架构的设计,完成了各个功能模块的流程设计,还完成了数据库的设计。4.对本文设计的备份系统进行了主要功能的实现以及性能评价和比较总结。实现了主要功能的开发工作和试运行,列举和展示了基本功能点的实现,并从多个方面分析比较了系统的性能。5.对本文工作进行了全面总结,指出了存在的不足和改进方向。实验表明,本文设计的备份系统在安全性、可靠性、可扩展性、经济性上有一定的优势。就安全性而言,通过对原始数据的加密压缩处理以及HDFS集群本身的安全机制大大提高了备份系统的安全性。就可靠性而言,备份数据以多份副本存储于不同数据节点上,即便某个节点发生故障,仍能保证数据的完整性。就可扩展性而言,HDFS集群可在不影响系统整体性能的情况下,添加数据节点以扩充容量。就经济性而言,集群采用廉价的闲置PC搭建,大大降低了备份系统的成本。