大数据中若干安全和隐私保护问题研究

来源 :湖南大学 | 被引量 : 11次 | 上传用户:candy129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云技术的发展、社交网络的兴起以及移动设备的普及,人类社会进入了大数据时代。相较于传统数据,大数据的结构和形式呈现多样化。从结构上来说,数据分为结构化、半结构化以及非结构化等;从数据形式上来说,主要包括文字、数值、图片、视频、表情、音频等。数据也不再由单一平台产生,如:社交网络平台、微博系统、移动app、可穿戴式设备、医疗系统等。然而,数据安全及隐私一直是人们担心的重要问题,其已然成为大数据发展道路上绕不开的绊脚石。如何高效利用大数据优势的同时,保证数据安全与隐私是一个亟待解决的问题。本文围绕大数据的信息安全与隐私保护展开深入研究,主要工作和创新点包括以下几个方面:(1)针对云存储系统中的重复数据删除服务进行安全和隐私研究。为了同时支持基于层次权限的重复数据检查和防止云服务商猜测用户的权限级别,提出了一种基于层次权限的谓词加密方案:Hierarchical Privilege-Based Predicate Encryption(HPBPE)。同时,为了支持权限的动态变化,如:权限提升、权限降低以及权限终止等情况,提出了一种支持动态权限的基于层次权限的谓词加密(HPBPE-R)方案。严格的安全证明和理论分析证明了方案的安全性和高效性。同时,实验结果验证了方案的可行性和高效性。方案的主要工作流程如下:首先,初始化配置将文件拆分为多个数据块,并为每个数据块生成相应的数据指纹。然后,用户针对数据指纹生成查询陷门,并发送给重复数据删除服务提供商。该服务商通过匹配指纹陷门与其平台存储的指纹密文确定云服务器上是否存有满足权限的相同数据块,如果匹配成功,重复数据删除服务提供商向云服务器请求文件存储位置,并反馈给数据用户;如果匹配不成功,数据用户在收到通知后,分别上传加密数据指纹和加密数据块至重复数据服务提供商和云服务器。(2)针对云平台的个人医疗数据进行了安全和隐私研究。为了实现不同密钥加密索引的合并处理,提出了一种多源保序对称加密方案:Multi-source Order-Preserving Symmetric Encryption(MOPSE)。同时,为了支持层次授权查询,即较高权限数据提供者可以查询并解密较低权限数据提供者上传的医疗数据,提出了一种支持层次权限的多源保序对称加密(MOPSE~+)方案。经过严格的安全证明和性能分析证明了MOPSE和MOPSE~+方案的安全性和高效性,并通过真实数据实验验证了方案的可行性。方案包含数据提供者、数据拥有者以及云服务器等三个实体。其主要工作流程如下:首先,数据提供者为数据拥有者的医疗数据建立多维B-树索引。然后,数据拥有者授权不同的数据提供者采用不同的密钥对其医疗数据及对应的索引结构进行加密,并上传至云服务器。当收到同一数据拥有者的多个索引时,云服务器在不解密的情况下合并这些加密索引,并拆分成两个索引分别供数据拥有者和数据提供者进行数据查询。(3)针对第三方社交数据服务商返回不真实查询结果进行了查询结果完整性验证研究。为了实现数据消费者验证其查询结果的真实性,提出了一种基于Merkle哈希树的验证方案。该方案需要为每个节点信息进行签名。为了减少签名操作,提出针对属性值的验证方案。该方案只需为每个独立属性值进行签名,从而降低了生成附加信息的计算开销。为了减少附加信息的存储开销,提出了基于布鲁姆过滤器的验证方案。虽然该方案存在假阳性,但是理论分析表明系统能够以非常高的概率检测出第三方社交数据服务提供商的不诚实行为(即使微弱改动社交数据)。安全证明和性能分析证明了上述三种方案的安全性和高效性;基于真实Twitter数据的实验结果表明方案性能满足实际需求。该方案以真实社交数据外包服务为蓝本,主要包括在线社交网络、第三方数据服务提供商以及数据消费者等三个实体。方案的工作流程如下:在线社交网络为其平台下的社交数据生成不可篡改的附加信息,并将其与原始社交数据外包至数据服务提供商;当收到来自数据消费者的社交数据购买请求时,数据服务提供商查找相应社交平台数据并返回查询结果给数据消费者。同时,数据服务提供商根据查询结果和附加信息生成可验证信息并将其返回给数据消费者;数据消费者结合查询结果和可验证信息验证查询结果的完整性和正确性。(4)该工作以目前流行的移动支付app(Venmo)为对象,研究用户在其平台上公开交易记录和交易说明带来的用户位置信息泄露问题。为此,提出了一种多层位置猜测技术:Multi-Layer Location Inference(MLLI)。该技术基于两种假设:大量的交易说明包含隐式的位置线索;用户交易的类型和时间模式与用户的位置存在密切关系。以三个月的Venmo公开数据为数据集,MLLI技术能够分别以50%,80%和90%的准确度识别Venmo用户的位置在top-1,top-3和top-5个可能位置中。猜测过程具体如下:MLLI技术首先采用文本挖掘算法针对每条交易说明提取关键字。由于每个关键字与位置关联度不同,因此将关键字及其对应的交易记录分成四个类别(类别数字越小的交易记录对应的位置关联度越高)。然后,MLLI为每个类别的交易记录构造加权无向图。当用户之间存在至少一条交易记录时,用户之间存在边且其权重计算依赖交易模式。接着,MLLI找出部分位置信息公开的用户作为种子节点,并针对每个类别分别采用迭代多层置信度传播方案为非种子节点计算位置置信度。最后,MLLI为每个非种子节点加权位置置信度并给出top-κ个可能的位置信息。
其他文献
人生是一片大海,市场是一片大海。13年前,牟其中从300元起家,驱动起中德商店这叶飘颻于风雨中的舢舨,从川东长江岸边的一个小城出发,冲入这片大海,几番浮沉,几番搏击,几度坎
在领导活动中,一个单位的绩效如何,关键取决于领导班子的状况。而这一点,又与一把手在领导班子中的地位和作用有直接关系。正确认识一把手在领导班子中的地位和作用,对于加强
领导干部要注重培养理论思维能力雷中喜编者按在改革开放和现代化建设的今天,我们各级领导干部都应重视理论思维能力的培养和提高。那种只重“实干”不重视理论思维的领导者,只
肝移植是治疗终末期肝病最有效的手段。但由于该类患者自身极其复杂的病理生理状态,加之手术打击,常常导致术中术后出现缺血再灌注综合征(IRS),影响手术效果,甚至危及患者生
现代管理以人为中心,强调参与的重要性,目的在于调动人们的生产、工作积极性。但在具体实施中,必须根据每个人的现实需求,采取灵活多样的方法,才能达到目的。本文从人的现实
<正>栉风沐雨谱华章。2017年,中铁建设集团机电总承包事业部可谓硕果累累,分别喜获一项鲁班奖、两项国家优质工程奖、一项中国安装之星。其中合肥枢纽南环线合肥南站工程荣获
不可否认,我们各条战线基层领导班子中的成员,不论是党员干部还是非党干部,绝大多数是好的和比较好的,在任何情况下都是能够经受住考验的,他们没有辜负党和人民的重托,不愧人
随着社会竞争日趋激励,压力似乎已经成为人们茶余饭后谈论的焦点。不同的个体面对同一个压力源,会有不同的认知水平与感觉体验,有的人把压力看作是一种挑战或机遇,有的人则会
领导干部中的同级关系,包括各个层次上的同级正职、同级副职、同级常务委员、委员和其他同级领导干部之间的关系,是一个微妙的特殊的关系层次,有其特有的矛盾“触发点”,主要
实事求是说起来简单,做起来则不那么容易。生活中常有这样的现象:从同样的事实中,不同的人们(这里并非指阶级立场不同)常常可以得出不尽相同甚至完全相反的结论,也就是说,从