论文部分内容阅读
云计算思想的提出起源于对计算服务边界的经济学定义,它是一种利用互联网实现按需、便捷访问共享资源池(如计算设施、存储设备、应用服务程序等)的计算模式。云计算采用虚拟化技术来聚合云数据中心的软硬件资源,并以服务的形式交付给用户,使得用户可以像使用水、用电一样按需租用和支付云的计算资源。云计算提高了资源复用率,并利用其规模经济性降低社会整体信息化成本。
这也对云的计算资源可管理性提出了更高的要求。从商业模式来看,要求云计算能按需快速地部署云应用/云服务所需的软硬件资源,快速构建云计算集群。从经济性出发,要求云计算能根据工作负载动态增减集群的物理设备,以节能增效,提升设备使用效率;从安全性角度,要求云计算能够良好地隔离和保护用户数据隐私。然而,云的存储问题不同于计算问题,因为“数据存储”的特殊性,这依然是云存储资源管理不可逾越的难题。
虚拟机可以封装云计算的各类软件和硬件的配置(CPU、内存等),虚拟机的克隆和复制功能能够实现云应用集群的快速部署,但是这需要虚拟机镜像磁盘的多版本快照机制的支撑。当前公开的磁盘快照技术方案数量有限,对系统性能影响较大,并且常用的技术方案不能完全保证快照和回滚数据的完整性和安全性。为此,本文提出了SNPdisk半虚拟化结构的CoW快照存储系统,能够高效地支撑云计算中的虚拟机池化管理。SNPdisk中采用一种新的稀疏树地址索引结构,缩减了索引所需的内存占用,减少了对磁盘的读写需求。它是一种分级索引机制,随着快照文件数据的增涨,索引树将尽可能地递层缩减,避免了索引数据的线性增涨。系统性评测数据显示了SNPdisk的快照机制有着明显的性能优势;文中给出的数理分析与证明,明确验证了SNPdisk多版本快照机制的数据安全性,能够保证在当前数据崩溃的情况下,虚拟磁盘可以安全完整地回滚到之前的数据版本。
云计算的运营模式决定用户数据需上传到云数据中心中存储和计算,用户数据隐私的保护成为云存储的一个关键性需求。已有的云存储安全方案主要采用密钥加密、秘密共享或数据分散式的方法,但是密钥加密方案的密钥管理困难,密钥的泄漏对数据隐私的危害极大;简单的数据分散对安全性提升并不显著;而秘密共享存储系统性能不高,通常只作为档案管理。针对块级云存储的构架,本文给出了SDS-CC数据分散式安全池化存储系统,一个基于陪集编码实现的安全存储机制。一方面能够满足基本的云存储池化管理的性能要求,另一方面能够有效地提升用户数据的安全性。即使部分存储节点被攻陷或部分管理员不可信,也能保护用户数据的隐私。在SDS-CC中,我们设计一套高安全性的陪集编码方案,并且针对云存储的性能需求,给出了完整编、解码优化算法,SDS-CC原型系统的性能测试结果表现出比传统非密钥加密存储系统更优异的性能。
已有的云数据中心软件节能技术中,“计算”的节能问题可以借助虚拟机技术来完成,“封装”了各类计算的虚拟机可以在物理服务器间动态迁移,根据负载变化,来整合物理服务器,关闭或休眠闲置的服务器。但是云存储的节能问题却面临着不同的难题,海量的数据很难在短时间内被全部移动,关闭部分存储节点服务器有可能造成数据不可用,甚至数据丢失。现有的云存储节能研究工作不多,成型的节能云存储系统更少。为此,我们针对DHT云存储构架给出了Cloudy-PS高可用的节能型云存储系统,给出了一个DHT节能模式切换协议,在严格保证原有数据一致性和系统高可用的前提下,Cloudy-PS可以在数分钟之内,完成必要的数据同步,并休眠或关闭存储集群中的大部分节点。与传统的DHT云存储的节能方法相比,Cloudy-PS不会降低数据可用性,在集群收缩和扩展时,对系统整体性能影响更小。
从云存储的数据安全性角度来看,本文给出的SDS-CC方案可以提升用户数据的机密性;SNPdisk保证了对灾难性事件的数据版本可恢复性和数据版本的完整性;Cloudy-PS确保了高性能模式和节能模式下的数据可用性;因此本文的主要工作,也分别对应数据安全三要素,即CIA(confidentiality,integrity,availibility)。本文的研究工作基本覆盖不同层次的安全需求,所给出的原型系统基本可以构建一个完整的云存储系统,强化云数据的CIA三个方面的安全性。