云存储系统中数据去重安全性方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:simonhill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球数据总量的指数级增长,大规模数据的存储和保护成为重要研究挑战。云存储系统提供大容量、可扩展和按需付费服务,因此越来越多的用户和企业将数据发送到云存储系统。针对数据集分析发现存储系统中存在大量冗余数据,云存储系统采用数据去重来削减冗余数据以节省存储成本和网络带宽。然而数据去重云存储系统面临着安全风险及其解决方法带来的性能问题,例如数据去重加密方法的机密性与时间开销,文件上传和文件访问中的隐私保护与计算开销,以及共享数据的可用性保障与存储开销等问题。如何构建安全且高效的基于数据去重的云存储系统是目前亟待解决的问题。因此,研究了云存储系统中数据去重的高效机密性保护,文件上传和文件访问中的数据隐私性保护,以及系统可用性保障等相关方法。针对现有的数据去重加密方法面临的暴力破解攻击或较大时间开销问题,提出了一种基于用户感知的收敛加密方法SecDep,采用了用户间文件级基于服务器协助加密算法并结合用户内块级基于用户协助加密算法生成随机安全密钥,以抵抗暴力破解攻击和减少整体时间开销。用户间去重面临的安全风险高,现有方法是在块级采用基于服务器协助加密算法提高安全性,但需要大量幂指数运算导致时间开销大。分析发现用户间冗余数据主要是重复文件,因此SecDep在用户间文件级采用高安全加密算法而在用户内块级采用低开销加密算法,同时采用了用户间文件级和用户内块级的两级去重保证去重率。为保证密钥安全性,SecDep利用文件级密钥加密块级密钥,然后利用Shamir秘密共享编码文件级密钥并发送到分布式密钥服务器。安全分析证明SecDep能抵抗暴力破解攻击和保证数据机密性。实验测试表明相对于现有抵抗暴力破击攻击的方法DupLESS-chunk,SecDep减少了52%-92%时间开销且只损失2.8%-7.35%的去重率。在基于数据去重的云存储系统的文件上传时,客户端需要向云存储服务端进行所有权证明以保证确实拥有文件内容来抵抗哈希证明攻击。针对现有的所有权证明方法存在误判导致的隐私泄露和数据更新开销大的问题,提出了一种基于两级验证和高效数据更新的所有权证明方法AS-PoW,结合布谷鸟过滤器验证和代数签名验证的挑战应答协议来抵抗哈希证明攻击和避免隐私泄露,同时通过准确定位和部分更新来减少更新开销。为避免隐私泄露,AS-PoW对文件的数据块密文构建布谷鸟过滤器,并利用布谷鸟过滤器进行两级验证的挑战应答,即云存储服务端首先随机选择多个块索引作为挑战块并在布谷鸟过滤器中检查客户端应答信息,若通过第一级验证,云存储服务端进一步验证代数签名同态性,通过计算挑战块和的签名是否等于挑战块签名的和进行判定。现有的基于布隆过滤器方法采用定长分块且不支持删除操作导致更新开销大,因此AS-PoW利用基于内容的分块方法快速地定位更新内容,且利用支持删除的布谷鸟过滤器只上传更新数据来减少更新开销。安全分析证明AS-PoW能抵抗哈希证明攻击和保证数据隐私性。测试结果表明相对于BF-PoW,AS-PoW减少了64.5%-66.5%的更新时间开销。在基于数据去重的云存储系统的文件访问中,对多用户共享数据采用访问控制方法来保证数据隐私性。针对现有的访问控制方法存在对小文件计算开销大且不支持灵活用户撤销的问题,提出了一种基于相似性加密去重的访问控制方法EDedup,聚合小文件成段并利用相似性生成密钥加密数据来减少计算开销,同时利用基于代理的属性加密管理文件元数据以实现灵活用户撤销和减少元数据开销。传统采用最小哈希作为代表哈希的相似性方法会导致隐私泄露,因此EDedup利用源端相似段检测来选择代表哈希并在段级利用基于服务器协助加密算法加密数据,且在目标端进行重复数据块检查保证隐私性。为减少元数据开销和支持灵活撤销,EDedup对重复文件元数据只保存一份,且用户被撤销时由代理对密文重加密。测试表明相对于SecDep,EDedup提升了约36%的加密速度;相对于REED减少39.9%-65.7%的元数据开销。针对现有的数据去重可用性保障方法存在扩展性差或存储开销较大的问题,提出了一种基于数据去重感知的低开销数据冗余方法DARM,发掘数据去重语义特征来标记数据块,然后对文件间和高引用数据块采用副本策略来提高扩展性而对其他块采用纠删码策略,从而保证数据可用性和降低存储开销。分析数据去重语义特征,例如,文件间/文件内重复块、数据块大小和块引用计数等特征,发现文件间和高引用数据块对存储可用性影响大且占据空间小,因此对于文件间和高引用数据块,DARM采用动态副本策略并随引用次数适当增加副本个数来提升可用性;而对于非重复和低引用数据块,DARM采用纠删码策略来保证存储效率,从而以较低存储开销来增强存储可用性。测试结果显示相对于经典的Deep Store,DARM最高减少了43.4%的存储开销且只降低很少的数据可用性。
其他文献
通过对我国大陆首例QQ号码盗窃案的法律适用问题的分析,指出在罪刑法定原则下,对此类案件以盗窃罪论处缺少充分法律依据,建议通过完善计算机犯罪、侵犯通信自由罪以及建立对
过往的创伤会深藏于人的潜意识中,在潜移默化中影响人的一生。一次父母打骂、一场噩梦般的考试、被同龄人欺侮孤立……这些被淡忘的过往创伤,就是被遗忘的内在小孩。内在小孩
全自动生化仪(BeckmanCx9)中Cx3急诊系统,用血量少,测试速度快(8项常规生化只需1分钟),但在标本处理上,由于血清分离费时,特别是在冬天,需要时间更长,即使采用真空管(内含分
测定了山西设施栽培条件下不同种植年限耕层土壤的理化性质。结果表明,设施栽培条件下土壤有机质、电导率、全量养分(全氮、全磷和全钾)和速效养分(碱解氮、速效磷和速效钾)含量与
“谁能回答这个问题?”见没有人举手,授课的颜老师又大声地询问了一遍,并用盼求的目光像探照灯似的在教室里往返搜寻。
高丽义通在中国天台宗行将中绝的五代之末,自三韩来至吴越,挺志修学天台教观。他上承螺溪义寂,下启法智、慈云,使天台教观在将绝之际勃然中兴。天台后人尊其为十六祖,称其为“通师
自从2012年,国家对于行政事业单位的内部控制监管越来越加严格,因此也定制了相关的指导文件指引我国行政事业单位内部控制的发展。合理的内部控制制度可以保障行政事业单位的
目前生产中推广的绿色生产技术多为单一技术,集成技术相对较少,技术综合效益难以充分发挥,优质、高效、绿色等多重目标难以同步实现。已有的集成技术模式也多为单一技术简单
期刊
为了构建稳定性高的行业供应链网络,提出一种合作伙伴关系组合选择模型。针对供应链上的成员进行模糊评价,以获得供应链成员在同一身份地位群体中的优度值;基于多色集合理论,