论文部分内容阅读
随着网络信息技术的快速发展,各类用户数据呈现爆炸式的增长,各种大数据分析技术在给人们的生活带来便利的同时,也给用户隐私保护带来了严重威胁。差分隐私保护技术为解决用户敏感数据泄露问题提供了一种新方法,其主要思想是通过输出扰动对查询结果添加随机噪声,使得即使攻击者拥有最大背景知识,也无法根据查询结果获取准确的个体信息。面对一些新场景和新需求,现有的差分隐私保护技术还存在一些不足,导致用户敏感数据的隐私保护减弱。例如(1)只能提供相同级别的数据保护,数据拥有者无法灵活地为不同查询用户提供不同隐私性和可用性的数据信息;(2)对所接收查询请求的无记忆性,在面临重复查询攻击时存在隐私保护程度减弱的安全隐患;(3)只是将数据泄露风险控制在一定范围,当所添加的随机噪声落在极小的一个区间时,攻击者很容易通过差分攻击和概率推理攻击分析获取准确的用户敏感数据。为此,本文依托于国家科技重大专项“新一代宽代移动通信网”课题“5G安全防护技术研究与验证”(No.2018ZX03002002)和国家自然科学基金“面向5G网络切片的虚拟化资源管理技术研究”(No.61801515),为解决现有差分隐私保护技术存在的缺陷和不足,从分级查询控制、数据可用性分析、隐私保护规范度量以及概率推理攻击分析等多角度出发对提高差分隐私保护的能力进行了多方面研究,主要研究内容如下:1、提出一种基于分级查询控制的差分隐私保护方法。该方法首先根据查询者的信誉值、查询权限量化查询者信任值,然后结合数据隐私属性要求计算查询安全信任度,并映射为不同的信任等级和隐私保护参数,最后根据确定的隐私保护预算参数向查询结果中添加服从Laplace分布特征的随机噪声,实现灵活的差分隐私保护并使返回结果具有不同的数据可用性。理论分析和仿真实验表明所提出的方法能够为不同等级查询用户提供误差率在0.1%~30%范围内的数据信息,解除了差分隐私保护仅提供相同级别隐私保护的限制,较好的解决了多信任等级用户查询的隐私保护问题。2、提出一种面向重复查询的个性化差分隐私保护方法。针对现有差分隐私保护技术在应对重复查询攻击时存在隐私保护效果减弱的安全隐患,首先根据查询者权限、查询次数以及被查询数据的隐私保护要求生成新的隐私保护规范,然后构建面向重复查询的个性化差分隐私保护算法改进隐私保护预算参数的选择,通过添加不同分布特性的随机噪声使得查询返回结果泛化程度不同,使重复查询的后续返回结果的数据可用性不高于第一次查询结果的数据可用性。仿真实验表明所提出的算法在应对重复查询请求时,返回结果的相对误差值随着查询次数的增加而增大,可灵活地为海量数据的聚合查询提供细粒度和差异化的隐私保护,有效解决了重复查询攻击带来的隐私泄露威胁。3、提出一种基于置信度分析的差分隐私保护方法。该方法首先分析了攻击者概率推理攻击模型中的攻击者置信度,推导攻击者置信度与置信区间、噪声分布位置参数、尺度参数之间的对应关系;然后针对不同用户查询权限的差异配置,根据数据隐私属性所设置的隐私概率阈值推导确定隐私保护预算参数的选取范围,设置合理的隐私保护参数,降低用户敏感数据泄露的风险。仿真实验分析表明,所提出的方法根据查询权限、噪声分布特性以及数据隐私属性分析攻击者置信度与隐私保护参数的对应关系,并据此推导出隐私保护参数的配置公式,从而在不违背隐私保护概率阈值的情况下配置合适的隐私保护参数。