海量查询下基于K-匿名的隐私保护算法研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:zhwenh_0421
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在一些开放性较强的用户平台如社交网络、微博平台等,用户数据往往是公开的,任何注册用户甚至匿名用户都可以直接查看这些数据,如果不采取一定的措施来防止潜在的隐私泄露,将会造成敏感数据的泄露,从而危害到数据的发布者甚至整个平台。在已有的隐私攻击方法中,防止推理攻击而造成的间接性隐私泄露一直是隐私保护领域的研究重点,但是已有的技术又存在两大问题:第一,只能检测出K-匿名中K=1的隐私泄露情况,隐私保护的控制粒度过小,且需要耗费较大的系统资源来维护整个查询历史及其结果,无法同时保证检测代价的最小化和查询响应的低延迟;第二,由于泛化问题是N-P难问题,对存在隐私泄露的数据表进行全局泛化,已有的基于K-匿名的算法泛化代价过大。对于推理攻击的隐私保护问题,本文主要从两方面去研究:一是对用户查询结果进行检测,判断其是否可以与历史记录链接从而导致隐私泄露;二是根据检测结果对造成隐私安全问题的查询结果进行局部泛化。针对用户查询结果进行检测这方面,本文提出了一种海量查询下基于K-匿名的隐私泄露检测算法(K-Q)。K-Q算法通过设定的K值对当前查询结果和历史查询结果的分析和推导,来判断当前查询是否存在隐私泄露的可能,保证较高的隐私泄露检测率。面对推理检测需要的所有历史查询结果的数据规模较大这一问题,它结合K-匿名模型在历史查询结果的存储规模上进行了优化。K-Q算法使用图状结构KGraph来维护历史查询结点之间的关系,能够及时对当前查询的输出和所有相关历史查询输出进行联合计算,提高了检测速率和降低了查询响应的延迟,同时保证了隐私保护级别的可控性。实验表明,K-Q算法计算效率明显优于已有的直接基于相关元组合并优化的推理检测算法(T-D),且可以自适应于查询规模的增长。针对K-Q算法检测出的导致隐私泄露的查询结果,本文提出了一种新的泛化算法(G-Q)。它摒弃了K-匿名的全局泛化思想,只对当前查询输出中能够与已有的发布数据进行联合分析导致隐私泄露的属性进行局部泛化。G-Q算法依据K-Q算法中设定的K值来判断需要泛化的属性,只有属性集合在查询输出中出现的次数小于K才需要进行泛化处理,从而大大降低了查询数据的信息损失度,也保证了数据的可用性。经过G-Q算法泛化的查询结果在系统设定的K值内达到了隐私保护的作用。最后通过实验验证,G-Q算法能有效地保证查询输出的精确度。
其他文献
万维网作为广泛分布,巨大的全球信息服务中心,包含了各种动态,庞大的访问和使用信息,发现信息背后的知识,对于用户访问和个性化服务具有重要的意义。本文针对Web服务器日志的
在生活的各个领域,数据预测具有普遍性,对时间序列预测技术的研究具有深刻的现实意义。本文分别对线性、简单非线性及复杂非线性时间序列的预测问题进行研究。对现有时间序列预
由于基于物理方法的模型变形技术充分运用了待变形模型的物理属性如质量、密度及相关的物理学原理,能够很真实地再现可变形模型的运动形变,所以此类方法能够很好地模拟可变形三
近些年来,无线网络技术的发展取得了革命性的进步。涌现了一大批异构无线网络,这些形式各异的无线网络,共同组成了下一代泛在、异构的无线网络环境。下一代无线网络要求实现“5W
软件测试用来发现软件错误和缺陷,从而达到保证软件质量的目的。软件测试是软件开发周期中重要的环节。生成合适的测试数据是软件测试过程中的重点和关键。手工构造软件测试
随着知识经济时代的到来,信息已成为这个时代的最重要标志之一,对于信息的获取与管理也越来越得到重视。信息的表现形式也从最初的结构化、半结构化逐渐向非结构化过渡。对于
无线传感器网络由大量计算能力低、存储量小和能量有限的微型传感器组成,具有广泛应用前景。Sink移动的无线传感器网络因其能量消耗较低和生命周期较长的特点,被推广到军事监
随着计算机技术和网络技术的不断发展,从海量数据资源中获取有用的信息,已成为广大用户急需解决的一个问题。蒙古文是我国重要的少数民族语言文字之一,随着蒙古族人民网络知识的
随着信息时代的到来,互联网已然成为人们社会生产活动、家庭生活娱乐的一个重要组成部分。作为一个覆盖全球的庞大系统,计算机网络本身运行的可靠性变得尤为重要,这一现状也对网
随着空间探测技术的快速发展,星载设备处理的数据量迅速增长,对星载设备的数据传输总线提出了更高的要求。SpaceWire总线是一种更好满足现代星上设备间高速数据传输需求的传输