论文部分内容阅读
随着云计算在学术界和工业界的兴起,云端存储的敏感数据量逐渐增多,例如,电子邮件,个人健康记录,隐私的视频和照片,政府文件等等。如果将数据存储到云端,用户可以实现最大程度的存取效率和最小程度的管理开销。这样用户就可以避免数据的管理和存储的负担,从而按需享受高质量的数据存储服务。现实是用户和云服务不在相同的可信域,因为数据外包可能存在风险,因此云服务的可信度就很值得我们去考虑,因为云服务器在运行过程中可能泄露一些信息给未授权的用户,所以敏感数据在外包前必须经过加密同时必须抵抗未被授权的访问者。当然,数据加密后使得数据的有效利用成了目前的一个挑战,有可能需要加密大量的外包文件数据。更近一步讲,在云计算里,用户可能给大量云用户分享自己的数据外包文件,每个用户可能仅仅想在特定的区域内检索并取回特定的明确的需要数据文件。最流行的方法是通过加密关键字搜索加密文件来代替直接检索全部文件,这在云计算环境下不现实。基于关键词搜索的技术允许用户选择检索需要的文件已经被应用于明文搜索的环境,例如Google搜索引擎等。遗憾的是,数据加密限制了用户执行关键词搜索的能力,因此传统的明文搜索的方法不适应云计算。此外,加密的数据同样要求保护关键词隐私,这是由于关键词经常包含一些与相关文件有关的重要信息。所以,要使用加密关键字来保护关键字的隐私,这就更加使得传统的明文搜索不适应与云环境。目前,解决云计算中关键字搜索可以分为两类,即精确关键字搜索与模糊关键字搜索。传统的可搜索加密方案仅支持精确关键字的搜索,在效率和性能上都不能适应云计算环境,模糊关键字搜索允许用户搜索加密数据的一些近似的关键字,这种方案适用于非精确关键字集合的匹配搜索。为了实现对加密数据的搜索,搜索加密技术已经在这些年得到快速发展,搜索加密方案通常为每个文件提取所有可能被搜索的关键词建立索引。索引里的关键字须对应相应的文件,陷门关键字包含在索引信息里。有效地关键词搜索必须建立在文件中存在和隐私保护的前提下。本论文从以下几个方面展开研究:首先介绍了公钥加密关键字搜索的基本概念,从公钥加密搜索的定义出发介绍公钥加密关键字搜索的模型,从中引入公钥加密关键字搜索蕴含基于身份的加密。随后给出可搜索加密方案的构造,从双线性映射的概念、可证明安全性的概念、随机预言机模型与公钥加密的安全性来引入公钥加密关键字搜索具体方案的构造,最后对该方案的安全性做了分析证明。其次提出支持多种字符串类似性操作的R+树来构建索引,实现云计算中对加密数据的模糊关键字搜索,用编辑距离来量化关键字的类似度,提出了一种可以返回与精确关键字更接近的文件检索方法。通过字符串聚类提高了模糊关键字搜索的效率。利用模糊提取器建立一个具体的方案,实现模糊关键字搜索。并在完美安全定义下抵抗适应性敌手攻击。这种方案同样适用于其它近似的度量,例如:汉明距离,编辑距离,集合差等。此方案不需要用户提前构建和存储任何数据,仅需要利用秘钥加密数据文档与计算陷门关键字。另外索引表单包含着从模糊提取器提取的随机字符串,依照模糊提取器,该方案可以转换密文上模糊关键字搜索为明文上精确关键字搜索。