论文部分内容阅读
随着手机,可穿戴设备以及传感器技术的发展,计算机和电子通信技术的不断进步和普及导致多元化的数据呈现爆炸性的增长趋势。由此,大数据的概念应运而生。尽管大数据本身的复杂特性,例如,“5V”特征——大体量,多样性,时效性,准确性,价值性,给大数据的具体应用造成了阻碍与困扰,大数据架构目前仍然被广泛的研究与应用在各个方面,包括:医疗系统,政府管理部门,制造业系统,以及研究分析领域等等。 然而,大数据拥有的潜在能力,例如,数据收集,数据分析,数据存储,数据处理也产生新的难以解决的隐私问题:个人的敏感隐私数据在大数据时代能否被更好的保护,或者是否更容易被泄露。在众多研究大数据的领域中,最重要的领域之一就是找到衡量隐私危害和数据处理效率的平衡点,在保护用户隐私的前提下,保证数据处理和分析的效率。为了解决隐私保护下的大数据分析和计算问题,本文主要分析并提出两个具体应用背景下的隐私保护计算方案,如下所示,分别针对高效的关联规则挖掘以及基于位置服务的近邻测试。 (1)随着数据爆炸性的增长以及云计算技术的不断发展,数据挖掘技术,如关联规则挖掘算法,K-Means算法,K近邻算法等,引起了广泛的关注。然而,数据挖掘技术蓬勃发展的同时,在大数据时代下也带来更多的安全问题和挑战。其中,最主要的的问题之一就是在保证用户数据隐私不被泄露的前提下,在云服务上进行数据挖掘。为了解决这种情况下的隐私问题,我们提出了一个高效且灵活的协议,称为EFPA,用于完成基于隐私保护关联规则分析算法。根据设计的EFPA协议,大量参与者(数据提供者)可以提供他们的敏感加密数据给云服务器,同时云服务器可以在云端运行关联分析算法而无法获取来自用户任何的明文数据和隐私。详细的安全分析表明,EFPA协议可以完成基于隐私保护的关联规则挖掘算法。除此之外,实际仿真测试和性能分析也表明EFPA协议是高效的,并拥有很低的计算开销。 (2)随着手机设备的普及,基于位置服务的社交网络应用,如脸书,微信,推特等,被普遍应用于人们的生活中。然而,由于位置信息是十分重要和敏感的,这些社交网络应用可能带来严重的安全问题,并对用户的位置隐私产生严重的安全隐患。为了解决社交应用中位置隐私问题,我们为基于位置的服务提出了一种基于隐私保护的高效近邻测试方案,称为EPPD。在EPPD方案中,用户可以测试他们是否在一个特定的范围内,同时保护自己的位置隐私。具体来说,EPPD包括两个阶段:首先,用户周期性的上传他们加密的位置数据给服务提供商;随后,用户可以发送测试请求给服务提供商进行近邻测试并获取测试结果。详细的安全分析表明EPPD方案可以完成基于隐私保护的近邻测试算法。另外,实际仿真测试和性能分析也表明EPPD是高效的,并拥有很低的计算开销和通信开销。 为了更好的理解现存的隐私保护技术并和我们提出的隐私保护方案进行比较,我们也回顾并讨论了一些流行的技术,包括,同态加密算法技术,安全多方计算技术,差分隐私技术,匿名技术,以及不经意读写技术等等。