论文部分内容阅读
云计算实现计算、存储、数据等资源的按需提供,资源拥有者与使用者相分离导致其数据安全保护面临严峻的挑战。云端数据加密及处理是开放空间数据保护的有效手段,云加密数据库是基于密码学的数据安全保护系统。但是现有的面向加密数据库的字符串模糊查询方案在可用性和安全性方面都无法满足日益增长的云计算服务安全保障需求。本文聚焦于云加密数据库中字符串模糊查询,设计了一种可抵抗统计攻击的字符串模糊查询方案,为了进一步提高汉字字符串在密文上的模糊查询效率,设计了一种针对汉字字符的高效密文模糊查询方案。具体工作如下:现有基于向量索引的模糊查询方案(BF方案)使用Bloom过滤器为关键词构建向量索引,但向量索引中索引值频率分布的偏差引起针对索引的统计攻击,导致敏感信息泄露。引入噪声向量,本文提出一种密文数据库中可抵抗统计攻击的模糊查询方案(S-BF方案),通过噪声向量消除索引值频率分布的偏差性,解决针对向量索引的统计攻击问题。实验证明,相比于传统BF方案,S-BF方案能够在不损失模糊查询效率的前提下,实现云端数据隐私保护的模糊查询。基于向量索引的模糊查询方案应用于汉字字符时因汉字索引碰撞概率高导致了模糊查询方案效率低下。进一步改进S-BF方案,本文提出一种云加密数据库中针对汉字字符的高效模糊查询方案(MS-BF方案)。该方案构造了布隆过滤列和最小哈希列两个辅助列,布隆过滤列基于S-BF方案实现,通过自适应选择汉字编码方式减小索引碰撞;为了构造最小哈希列,提出了基于MinHash的模糊查询方案,为单个明文数据建立多个向量索引减小索引碰撞,使用最小哈希函数对向量索引简化降维,节省索引存储空间,并在索引中插入伪造陷门隐藏真实索引,抵抗针对最小哈希列中索引的统计攻击。实验证明,相比于传统的基于向量索引的模糊查询方案,在保护云端数据隐私的前提下,MS-BF方案执行模糊查询的平均时间缩短了31.4%。基于以上研究,设计并实现了支持模糊查询的云加密数据库系统,将本文提出的两种模糊查询方案集成到系统中并进行测试,实现了云加密数据库系统中安全高效的模糊查询,验证了方案的有效性。