论文部分内容阅读
随着移动互联网和物联网的快速发展,全球数据量呈现爆炸式增长。由于云计算具有按需自服务、快速的弹性和可扩展性的特点,以及可提供专业的分析和计算服务,越来越多的数据拥有者(例如公司和组织)开始使用公有云存储和处理他们产生或收集的数据。但是,由第三方云服务提供商运营的云计算平台不是完全可信的,可能存在内部或外部攻击者,引发数据泄露。在云计算中保护数据隐私最可靠的方法是数据拥有者在外包前对数据加密。但是,传统的加密算法完全破坏数据可用性,不支持密文查询和计算,限制了云计算服务的功能;而全同态算法计算开销过高,无法在实际中应用。本文针对具体的应用场景和计算需求,解决云计算外包环境中密文查询和计算的若干问题,包括:(1)在密文上进行top-k查询。目前在密文上进行top-k查询最高效的方法是使用保序加密(OPE),但是OPE同时保留了非top-k明文的顺序,造成不必要的隐私泄露。为了解决这个问题,我们提出最值保序加密(TOPE)。相比OPE,TOPE只保留了明文的“最值”属性(即一组明文中最大或最小的明文的顺序),可用于在密文上进行top-1查询。我们形式化定义了TOPE及其安全性IND-TOCPA,并利用堆结构给出一个具体的TOPE构造,然后扩展提出的TOPE方案,以支持top-k查询,使得top-k的明文对应的密文大小还是top-k的,而非top-k的明文对应的密文的不再保持明文的顺序。我们形式化地证明了TOPE的安全性,对TOPE的性能进行实验分析。实验结果表明,在TOPE密文上进行top-k查询的效率和明文查询一致。(2)在密文上进行范围查询。可搜索加密(SE)允许不可信的服务器在密文上执行不同功能的查询,例如关键字搜索和范围查询。为了提高搜索效率,大部分SE会泄露访问模式。但是,对于支持范围查询的SE,攻击者可以利用访问模式构造范围注入攻击,恢复出加密的数据索引值。为了解决这个问题,我们提出首个有效缓解范围注入攻击的方案,称作Randex,使用随机化回答在加密前混淆数据索引值,从而混淆访问模式。Randex与任何支持范围查询的SE兼容。我们形式化地证明了Randex符合本地差分隐私的定义,给出攻击者在范围注入攻击中的平均猜测概率。实验结果表明,Randex可以有效缓解范围注入攻击,同时对SE范围查询只有较小的影响。例如,Randex可以把攻击者的猜测概率从1.0降到0.17,同时只存在3.6%的漏报。(3)在加密位置数据上计算可达性。位置可达性指的是在一段时间内一个用户是否可以通过一系列位置上的接触到达另一个用户的位置,具有重要的应用,例如社交行为分析和公共健康监测。我们首次实现在加密位置数据上计算可达性。具体地,我们先提出一个基础方案,称作SecReach,利用布隆过滤器和部分同态加密(SWHE),实现2-hop可达性计算。在SecReach的基础上,我们进一步利用SIMD技术和Z阶曲线提高SecReach的计算效率,提出一个改进方案,称作FastReach。我们严格地证明了提出方案的安全性。在HElib库上的实验结果表明,相比SecReach,FastReach的加密效率提高400倍,可达性计算效率提高30倍,在1,000个用户的系统中计算两个用户之间的2-hop可达性最快只需要1.2秒。