论文部分内容阅读
随着网络信息数据爆发式增长,云存储在云计算的基础上飞速发展,目的是为了可以将企业和个人从繁重而复杂的数据存储中解脱出来。由于网络数据复杂,企业数据存储庞大,要求云存储技术应该具备良好的可靠性、可用性、可拓展性使得用户在使用过程中有良好的体验。数据保存多个副本是使得云存储能满足上述要求的重要手段,有效的副本策略是云存储系统的重要研究课题,创建副本的数量、副本的布局、副本间同步代价的控制都是需要深入研究的内容。本文主要研究个性化云同步系统中版本库副本创建和选用策略及模型,重点解决副本创建删除、副本冗余度、副本布局、副本选用等问题。论文的主要工作如下:论文首先分析了云存储的现状,总结出现有的云同步软件存在着以下问题:一、在移动端的使用上比较简单有限,难以满足现代人对于随时随地获取信息的需求;二、很多的云存储软件不具备履历管理功能,用户很难获取历史文件版本。针对以上两个问题,我们设计一种基于GIT和云存储的个性化云同步系统。该机制分为三层,基于GIT协议的存储层,基于云平台事务处理层,和移动端的用户层。论文重点研究了个性化云同步系统中版本库副本创建和选用策略及模型。从传统的HDFS系统的副本管理方法中获得思路,论文设计了一种基于文件热度的动态副本创建策略及模型,详细介绍了副本热度的计算方法和副本最大数量最小数量的推算方法和基于Topsis算法选择副本创建时的Buffernode节点的过程。随后,论文对于云同步过程中的副本选用的问题,提出了环境相似度和副本的可信度的概念,利用层次分析法确定节点可信度中各影响因素的权值,并给出了算法的步骤。在上述理论基础上,对论文中提出的个性化云同步版本控制系统开始进行实验模拟和分析,通过分析实验模拟的结果得出基于文件热度的副本技术相对于传统的HDFS模型,单位时间内能够处理更多的访问服务。而基于环境相似度和节点可信度的云同步副本选用模型,能够让系统更稳定的为用户服务。最后针对于分析的结果,提出了相应的改进方案,并对课题的发展前景进行展望。