论文部分内容阅读
随着云计算(Cloud Computing)和群智感知(Crowdsensing)等新型网络环境的发展,这些新型架构已经成为承载各类应用的关键基础设施。然而,新型网络环境下数据安全与隐私威胁日趋多样化、复杂化和规模化。这对数据的安全采集、存储与使用带来了严峻挑战。具体来说,在数据的安全采集阶段,现有的研究成果大多需要用户与服务器在线交互,无法满足在异常网络下支持用户离线的数据采集;在数据的安全存储阶段,现有的研究成果大多基于文本类型的数据存取,对于空间数据和DNA数据的安全检索方案较少,且存在效率低、访问控制弱以及查询功能单一等问题;在数据的安全使用阶段,尤其在基于大规模数据集的深度神经网络训练方面,现有的训练技术未考虑训练过程中计算结果的可验证性和用户数据质量的不一致性问题。针对上述挑战,本文研究新型网络环境(聚焦于云计算和群智感知)下数据在采集、存储和使用方面存在的安全问题。具体的研究内容如下:1.数据采集阶段安全的真值发现技术:(1)提出一种在单云配置下安全且支持用户离线的真值发现方案EPTD。该方案可实现在单服务器环境下支持用户离线的真值发现。除此之外,我们设计了一种双重数据混淆机制,其可以保证在真值发现过程中用户原始数据和权重的隐私性。(2)提出一种安全高效且支持结果验证的真值发现方案V-PATD。该方案可以高效地验证服务器聚合结果的完整性。除此之外,所设计的可验证方案满足公开可验证性、支持多数据源性、支持非固定的外包函数以及易扩展性。另一方面,我们设计了一种基于本地差分隐私的数据扰动方案,其不仅可保证单个数据的隐私性,同时保留了混淆数据和原始数据在统计性质上的不变性。2.数据存储阶段的可搜索加密技术:(1)提出一种支持任意几何区域内细粒度访问控制的范围搜索方案EGRQ。与现有方案相比,该方案可以显著降低索引和陷门生成过程中的本地存储开销。除此之外,我们构造了基于多项式的访问控制策略,其可以实现密文环境下对搜索用户细粒度的访问控制,从而保证每个用户只能访问其被授权的数据。(2)提出一种高效且支持细粒度访问控制和布尔查询的DNA相似度查询方案EFSS。在EFSS中,我们首次设计出一种安全的近似算法,其可将密文环境下DNA序列之间的编辑距离计算问题转化为二者的集合对称差计算问题。这可以显著减少密文下需要匹配的元素数量。此外,我们构造了一种高效的基于多项式的访问控制策略,其可以实现密文环境下对搜索用户细粒度的访问控制。我们设计了一种新的布尔搜索方法来实现复杂的布尔查询,如对基因进行“AND”和“NO”的混合查询。3.数据使用阶段安全的深度学习技术:(1)提出一种安全且支持对服务器计算结果可验证的方案Verify Net。该方案可实现在用户可接受的计算开销下验证服务器返回结果的正确性。除此之外,我们提出了一种对本地梯度的双重混淆方案,其可以保证在分布式学习过程中用户本地梯度的机密性。除此之外,该方案支持部分用户在协议执行过程中的异常退出,并保证在用户离线的情况下依旧可执行密文下的梯度聚合。(2)提出一种不规则用户下安全高效的深度学习训练方案PPFDL。该方案可实现对用户的梯度、可靠性以及聚合结果的隐私保护。此外,我们设计了一种新的策略去实现对每一个用户的权重(即可靠性)分配。对于权重低的用户,降低其生成的梯度在聚合运算中的比例,从而降低不规则用户对训练的负面影响。PPFDL同样支持部分用户在训练过程中的异常退出,并保证在一定量用户退出的前提下协议的顺利执行。对于上述的所有方案,我们都进行了充分的安全性分析,并证明了上述方案在已定义的威胁模型下的安全性。除此之外,通过大量的实验分析以及与现有方案的对比,论证了我们提出的方案在性能方面的优势。