论文部分内容阅读
P2P存储系统具有良好的扩展性,并且能够利用边缘网络计算机上的数量巨大的存储容量和网络带宽,具有巨大的服务潜力。自提出以来一直受到学术界的关注,但在其后的时期内却没有出现像BitTorrent这样的广泛流行的P2P应用。其中两个技术层面上的原因是:1,没有有效的可用性、可靠性模型作为P2P存储系统的理论基础;2,普通PC机用户构成的计算机环境复杂,搭建P2P存储系统并非轻而易举的工作。
本文将在更准确的可用性、可靠性模型指导下,详细介绍在普通PC用户上良好运行的P2P存储系统--AmazingStore--构建的细节、运行情况。并且分析系统长达1年的日志,发现一些有益的结论。
本文的主要贡献如下:
设计并实现了一个在高动态环境下真实可行的P2P存储系统AmazingStore:(1)采用自组织的簇结构来划分和管理节点。簇管理节点由服务器节点担任和管理节点的主从备份机制,提高了管理节点的在线率和系统的响应能力。
(2)使用自修复的索引维护策略。在管理节点切换时,索引双向比对方法使得索引能够被高质量地重建。bloomfilter技术则很大程度地减小了索引比对的传输开销。
(3)使用两阶段提交的机制解决了P2P存储系统中写操作的原子性问题,使得上传文件时,要么文件被成功存储,要么不对系统的数据状态和索引状态造成修改。
分析AmazingStore系统收集的长达1年的日志数据,发现了如下现象:
(1)AmazingStore系统存在一定程度的负载不均衡问题。这关系到P2P存储系统中负载均衡的标准。提醒我们在保证数据可用性和可靠性同时,对数据分发和修复调度要进行负载均衡方面的考虑。
(2)进行“破坏”行为的用户只占所有用户的小部分,在可接受的范围内。
(3)大部分用户存在着很大的剩余磁盘空间,可以用来搭建具有海量存储空间的P2P存储系统。