论文部分内容阅读
随着云计算和云存储技术的广泛应用,越来越多的数据拥有者倾向于将他们的数据外包给远程云服务器,以减少计算和存储的开销,但不可信的云服务提供商会使数据面临严重的安全威胁。常用的保护方式是在外包前对数据进行加密,然而这将导致在密文上执行查询操作变得困难,由此,可搜索加密技术应运而生。而现有的可搜索加密方案支持的功能比较单一,效率和准确度上存在提高的空间,方案设计的安全性也有待进一步增强。针对以上问题,本文着眼于面向功能的加密云数据查询关键技术,重点针对精确查询和模糊查询两种查询方案,从功能的完备性、性能的优化以及安全性的提高上展开研究。本文的主要研究工作包括以下几个方面:(1)面向可同时支持高性能和多种功能的查询需求,提出一种具有高准确度的、支持结果可验证和动态更新功能的多关键词排序查询方案。针对现有的密文查询中,采用的TF-IDF算法只考虑文档中某一关键词的数量TF以及文件集中包含该关键词的文档总数IDF,而忽略其他如关键词所处位置、文档长度等影响关键词与文档的相关性的因素带来的问题,论文通过将关键词位置信息和文本长度信息与传统TF-IDF算法相结合,并基于可优化查询效率的索引树结构的构建,实现了具有高准确度高效率的多关键词排序查询方案。最后基于该索引树的基本结构扩展设计了查询结果可验证和动态更新的查询方案。实验测试数据集中的文件均由包含固定的标题、摘要、正文、结论和参考文献等要素的论文数据组成,关键词在各要素中占有的权重各不相同,由此反映关键词位置和文本长度对文本相关性的影响。最终通过实验验证和理论分析证明了本方案的性能和安全性;(2)面向密文模糊查询对查询功能和结果安全性的需求,提出一种支持逻辑查询、且抵抗唯密文攻击的多关键词模糊排序查询方案。针对Lin等人[1]提出的基于布隆过滤器的模糊查询在唯密文攻击下存在的安全缺陷,且无法支持逻辑查询的问题,论文在Wang等人[2]方案的基础上,设计了基于随机数冗余混淆的模糊排序查询基础方案,该方案实现了原有关键词特征的混淆,使得查询模式得到保护,从而可抵抗唯密文攻击。论文进一步扩展该基础方案,实现了模糊查询下同时可支持与、或、非这类实际应用广泛的逻辑查询操作,通过这些操作用户能够自定义查询包含某些关键词的文件,或者不包含某些关键词的文件,由此得到更符合用户需求的查询结果。最后本章理论分析了方案的安全性,并通过在实际文本数据集上进行实验验证了方案的功能和性能。