论文部分内容阅读
随着互联网的蓬勃发展与智能设备的广泛普及,云计算已经成为当下的主流服务模式。通过云计算服务模式所提供的可用的、便捷的、可配置的计算资源(包括网络、服务器、存储、应用和服务等),个体用户和企业级用户均能充分享受云计算所带来的便利性、灵活性和可扩展性。针对大量用户的外包数据,传统数据去重技术虽然能够通过去除冗余数据提高云环境的存储效率与用户体验,但是难以保护用户大量的隐私敏感数据。为了平衡用户对外包数据的安全需求同云服务提供商对云环境的高效存储效率需求之间的矛盾,深入研究云存储环境下的安全去重技术具有十分重要的意义。为此,拟开展面向云存储的高性能安全去重技术研究,重点探讨如何平衡云存储环境下安全去重的可用性与安全性,为云服务提供商实现高性能安全去重提供强有力的技术支撑。
由于去除了可信第三方服务器的复杂假定,面向两方场景的安全去重方案更加易于被云服务提供商部署。针对已有面向两方场景的安全去重方法所存在的性能和安全问题,提出面向两方场景的高性能安全去重模型。此外,为了保证安全去重中冗余数据检测的数据隐私安全,本研究利用离散对数难题将用户的随机因子加入到冗余数据安全检测的数据结构之中,并从理论层面构造了一套高效的冗余数据安全检测流程。为了进一步支持数据拥有者同其他拥有数据所有者共享数据块所对应的加密密钥,本研究还提出一种离线型高性能密钥交换技术。通过理论和实验的证明,该方案不仅具有最新安全去重方案的安全强度,而且能够显著地提高安全去重性能。
云存储环境中因频繁修改而产生的多版本文件将导致安全去重过程中产生大量非冗余数据块。这些非冗余数据块同修改之前的数据块相比,仅仅只有少量的字节不同。然而,按照已有安全去重方法,这些数据块均会被认定为非冗余数据块,且最终被上传至云端。每一个非冗余数据块的产生都将对应生成一个数据块级别的加密密钥。针对现有安全去重方案无法有效地应对云存储应用场景中数据频繁修改所导致的安全去重性能下降和密钥管理开销增大的问题,本研究提出了一种面向多版本数据的安全去重方法,将修改后的内容存储在增量编码文件中,有效避免由离散型修改所导致的大量非冗余数据块上传。实验结果表明,该方法有效地降低了修改操作导致的非冗余数据块数量和加密密钥的维护开销。
针对安全去重的数据分块环节,本研究重点从实验和理论的角度对该环节中所产生的局部边界偏移问题分别进行验证和分析。作为安全去重中的重要环节,面向源端的分块算法中的数据块最大长度参数是产生连续最大长度数据块序列的根本原因。但是,由于该参数的设置初衷,分块算法必须要利用数据块最大长度参数控制数据块的长度,以便云端对数据块进行管理。因此,解决局部边界偏移问题的关键在于如何抑制由最大长度数据块所构成的序列产生。为此,本研究进一步开展基于源端的高效去重分块算法研究,突破基于反馈调节的可伸缩安全去重分块技术,解决现有安全去重分块算法中存在的局部边界偏移问题,提高在安全去重环境下的数据去重的分块算法效率。
虽然传统面向源端的分块算法可以通过使用较小的平均数据块发现更多的冗余数据,但这也同时增加了用于存储数据块之间关系与用户加密后密钥信息的元数据量,并对系统性能产生负面影响。为了在安全去重场景下同时考虑删除冗余数据的总量、元数据大小和加密密钥的数量,本研究针对云服务提供商更加青睐的两方安全去重场景,总结了两个用于设计基于云服务端辅助的高性能安全去重分块算法的原则,其中安全分块算法需要动态地、有选择地合并相邻的冗余数据块或非冗余数据块,同时保证与冗余数据块相邻的非冗余数据块处于较小的分块粒度。为此,基于云服务端辅助的安全去重分块算法需要支持由云端协助完成冗余数据安全检测过程。为了保证该过程的安全性,我们需要在该过程中加入用户随机因子和文件扩展因子以保证用户数据的隐私安全和降低冗余数据检测的计算开销。此外,本研究进一步提出基于云服务端辅助的反馈式分块算法将上述原则同安全去重分块方法有机结合。实验结果表明基于云服务端辅助的反馈式分块算法能够安全有效地降低安全去重场景中的元数据存储开销以及加密密钥的管理开销。
由于去除了可信第三方服务器的复杂假定,面向两方场景的安全去重方案更加易于被云服务提供商部署。针对已有面向两方场景的安全去重方法所存在的性能和安全问题,提出面向两方场景的高性能安全去重模型。此外,为了保证安全去重中冗余数据检测的数据隐私安全,本研究利用离散对数难题将用户的随机因子加入到冗余数据安全检测的数据结构之中,并从理论层面构造了一套高效的冗余数据安全检测流程。为了进一步支持数据拥有者同其他拥有数据所有者共享数据块所对应的加密密钥,本研究还提出一种离线型高性能密钥交换技术。通过理论和实验的证明,该方案不仅具有最新安全去重方案的安全强度,而且能够显著地提高安全去重性能。
云存储环境中因频繁修改而产生的多版本文件将导致安全去重过程中产生大量非冗余数据块。这些非冗余数据块同修改之前的数据块相比,仅仅只有少量的字节不同。然而,按照已有安全去重方法,这些数据块均会被认定为非冗余数据块,且最终被上传至云端。每一个非冗余数据块的产生都将对应生成一个数据块级别的加密密钥。针对现有安全去重方案无法有效地应对云存储应用场景中数据频繁修改所导致的安全去重性能下降和密钥管理开销增大的问题,本研究提出了一种面向多版本数据的安全去重方法,将修改后的内容存储在增量编码文件中,有效避免由离散型修改所导致的大量非冗余数据块上传。实验结果表明,该方法有效地降低了修改操作导致的非冗余数据块数量和加密密钥的维护开销。
针对安全去重的数据分块环节,本研究重点从实验和理论的角度对该环节中所产生的局部边界偏移问题分别进行验证和分析。作为安全去重中的重要环节,面向源端的分块算法中的数据块最大长度参数是产生连续最大长度数据块序列的根本原因。但是,由于该参数的设置初衷,分块算法必须要利用数据块最大长度参数控制数据块的长度,以便云端对数据块进行管理。因此,解决局部边界偏移问题的关键在于如何抑制由最大长度数据块所构成的序列产生。为此,本研究进一步开展基于源端的高效去重分块算法研究,突破基于反馈调节的可伸缩安全去重分块技术,解决现有安全去重分块算法中存在的局部边界偏移问题,提高在安全去重环境下的数据去重的分块算法效率。
虽然传统面向源端的分块算法可以通过使用较小的平均数据块发现更多的冗余数据,但这也同时增加了用于存储数据块之间关系与用户加密后密钥信息的元数据量,并对系统性能产生负面影响。为了在安全去重场景下同时考虑删除冗余数据的总量、元数据大小和加密密钥的数量,本研究针对云服务提供商更加青睐的两方安全去重场景,总结了两个用于设计基于云服务端辅助的高性能安全去重分块算法的原则,其中安全分块算法需要动态地、有选择地合并相邻的冗余数据块或非冗余数据块,同时保证与冗余数据块相邻的非冗余数据块处于较小的分块粒度。为此,基于云服务端辅助的安全去重分块算法需要支持由云端协助完成冗余数据安全检测过程。为了保证该过程的安全性,我们需要在该过程中加入用户随机因子和文件扩展因子以保证用户数据的隐私安全和降低冗余数据检测的计算开销。此外,本研究进一步提出基于云服务端辅助的反馈式分块算法将上述原则同安全去重分块方法有机结合。实验结果表明基于云服务端辅助的反馈式分块算法能够安全有效地降低安全去重场景中的元数据存储开销以及加密密钥的管理开销。