论文部分内容阅读
在当今互联网时代,云存储服务的迅速发展使得云端的用户数据爆炸式增长。为了节省云存储空间和网络带宽,基于客户端的重复数据删除技术在云存储中得到了广泛应用。该技术仅在云服务器上存储重复数据的单一副本。由于图像具有数量大、冗余性高等特点,对图像进行客户端的重复数据删除显得尤为必要。然而,现有的客户端重复数据删除方案大多是基于密码学哈希实现,这是一种精确匹配,不再适用于图像的重复数据删除。对图像而言,典型的操作如改变尺寸、压缩和格式变换只会改变图像的二进制表示,但其感知内容不变,这些改变后的图像可认为是重复数据。因此需要考虑对感知相似图像的模糊去重。另一方面,为了实现安全的客户端重复数据删除,“所有权证明(PoW)”被广泛应用于文件的去重复中,用于帮助云服务器验证用户是否确实拥有完整的原始文件。在新的图像去重复场景下,早期的“所有权证明”失效了。为了实现高效、安全的客户端图像重复数据删除,本文对现有方案进行了研究与分析,主要取得以下研究成果:1、提出了一种支持模糊匹配的客户端图像去重复方案。首先,对基于离散余弦变换的图像感知哈希算法进行了理论分析和实验验证,根据离散余弦变换谱系数的统计特性,在保留了DAN感知哈希算法(DAN-phash)优点的基础上,采用Zigzag编码进一步对感知哈希算法进行了改进。其次,给出了本方案中重复图像的定义,明确图像去重复的目标。然后,将改进的感知哈希算法应用到图像去重复方案中,使得可以匹配相似图像,达到了图像模糊去重的目的。最后,通过性能测试以及与现有方案进行比较,结果表明,当选取阈值为0.017时,对不同图像的误报率仅为0.046%,同时相似图像的识别率可达88.89%。在实际应用中通过合理设置阈值,在保证较高去重率的前提下,可显著降低对内容修改操作下不同图像的误报率,提高图像的匹配精度,增加方案的可靠性和抗攻击能力。2、提出了一种基于伪随机分块的相似图像所有权证明方案。该方案中用户需根据云服务器的询问信息及原始图像的内容来生成认证证据,完成所有权的证明过程。为了提高安全性,在认证过程中引入了伪随机机制保证证据信息的新鲜性,保护方案免于遭受证据重放的类似攻击,避免了攻击者只有图像的感知哈希值就能欺骗服务器获得图像非法授权的问题。该方案在保证了安全性的前提下,无需依赖辅助图像库,大大降低了云存储服务器和客户端的存储压力。