论文部分内容阅读
随着大数据时代的到来,全球数据呈爆炸式增长,云存储系统中数据规模已经达到ZB级别。相关研究表明,这些海量数据中存在大量的重复数据,这些重复数据消耗了大量的存储资源。为减轻云存储系统的存储压力,节省存储空间,数据去重复化删除技术,作为一种行之有效的“数据压缩技术”得到广泛地应用。该技术可以删除云存储系统中的冗余数据,其中,去重粒度越小,则去重比率越高,而且客户端去重技术还可以有效地减少用户上传带宽,节省上传时间。现阶段的云存储数据去重技术需要考虑保护用户数据的私密性,并提供云备份数据的更新操作,以更好地满足用户的现实需求。因此,可更新的密文块去重技术将成为数据去重领域的研究热点。然而,实现可更新密文块去重方案存在以下三大挑战:(1)如何实现跨文件的密文块去重;(2)如何安全高效地实现数据更新操作;(3)如何处理文件所有权回退问题,防止用户数据被非法访问。虽然现有的消息锁定式加密算法可以初步解决挑战一,但目前没有方案可以同时解决这三大挑战。对此,本文提出一种支持数据更新和文件所有权动态管理的加密文件块去重方案UBLDe(Updatable Block-level Deduplication with Dynamic Ownership Management on Encrypted Data),能够同时解决上述三大挑战。在UBLDe方案中,我们设计了一种支持结构更新的文件所有权认证结构,即动态平衡跳跃表DBSL(Dynamic Balanced Skip List),以实现对数级的高效更新操作。此外,我们提出了一种快速混杂分离算法MIX,服务器利用文件群密钥和MIX算法对一个文件中的所有密文块和密钥文件密文进行安全快速地混杂操作,以确保只有文件拥有者可以通过群密钥正确地分离出密文块和密钥文件密文,从而实现文件所有权的管理。最后,我们给出了UBLDe方案的安全性证明,并设计实验评估了UBLDe方案的性能,实验结果表明,UBLDe方案与现有的去重方案相比,具有计算量低、通信带宽少和实用性强等优点,适用于文件长度量级较大的云存储系统去重。UBLDe方案重点解决了加密文件块的去重和更新操作,以及文件所有权的管理问题。UBLDe方案能减少重复文件的上传带宽,但对于不重复文件中的重复密文块仍需要上传到服务器端进行去重操作,而且该方案没有明确地说明云服务器对文件和文件块的元数据存储管理问题。对此,我们在UBLDe方案的基础上,提出了一种支持文件块客户端去重和服务器端存储管理的密文去重方案BL-CDSM(Block-level Client-side Deduplication with Server-side Storage Management on Encrypted Data)。该方案同时实现了不同文件中细粒度的文件块客户端去重以及相同文件的粗粒度文件客户端去重,极大地减少了用户的上传带宽。为有效地提高服务器的管理效能,我们提出了一种高效的存储管理结构HTT(Hash Table Tree),该结构具有可扩展性,能够实现对文件/文件块元数据的存储、快速查找和更新操作,并构建“用户-文件-文件块”三者的关联关系,实现文件和文件块的管理。最后,我们给出了BL-CDSM方案的安全性证明,并设计实验评估了BL-CDSM方案的性能,实验结果表明,与UBLDe方案相比,BL-CDSM方案大大地减少用户上传带宽。在文件块去重比率较小的情况下,BL-CDSM方案会消耗较多的计算资源,但是当文件块去重比率达到90%以上时,该方案在客户端所产生的计算开销将大大减少,要优于UBLDe方案。