论文部分内容阅读
随着云计算的日渐成熟,愈来愈多的用户把数据存储在云服务器上。由于云服务器不完全可信,保护数据的机密性同时提供查询的隐私性就成为云存储中的热点研究问题。可搜索加密技术的提出为云存储中这一难题的解决提供了可行的途径。然而,模糊关键词的可搜索加密,尤其是面向中文的模糊关键词可搜索加密仍然是值得深入研究的课题。
本文针对模糊中文关键词的可搜索加密方案展开研究工作,主要工作成果包括以下三个方面。
首先,通过分析中文的特点,研究了针对中文的模糊集构造方法。本文根据分析传统的英文模糊集的构造方法,给出了三种中文关键词的模糊集构造方法。一种为基于通配符的汉字模糊集构造方法,此方法构造简单快捷;另一种为基于拼音的模糊集构造方法,此方法从对单个汉字的度量细化到基于拼音结构的度量;第三种方法为改进拼音的字典法模糊集构造方法,此方法对编辑距离计算规则有了更加细致的定义,而且在构造拼音串后会对其进行拼写检查,大大降低了模糊集的大小。仿真实验结果表明,基于通配符的汉字模糊集和基于改进拼音的模糊集构造方法对空间和时间的消耗较低。
其次,基于本文的中文模糊集的构造方法,提出了一个面向中文的高效可验证模糊搜索加密方案。在此方案中,给出的系统模型使数据拥有者和用户都不再承担繁重的计算任务,中文关键词模糊集和索引的构造等都交给私有云服务器来完成,从而提高了整个系统的效率;通过构造了有效的验证算法,验证公有云服务器返回的结果,使得搜索结果具有可验证性。仿真实验结果表明该方案具有高效性,且将基于改进拼音的模糊集构造方法结合在本方案中效率更高。
最后,本文对中文高效可验证搜索加密方案进行了功能扩展。将排序搜索引入到方案中,通过改进的TF-IDF规则,设计出一个支持排序的模糊中文关键词搜索加密方案。该方案使搜索结果更为有效,从而减少了一些不必要的时间和带宽消耗。
本文针对模糊中文关键词的可搜索加密方案展开研究工作,主要工作成果包括以下三个方面。
首先,通过分析中文的特点,研究了针对中文的模糊集构造方法。本文根据分析传统的英文模糊集的构造方法,给出了三种中文关键词的模糊集构造方法。一种为基于通配符的汉字模糊集构造方法,此方法构造简单快捷;另一种为基于拼音的模糊集构造方法,此方法从对单个汉字的度量细化到基于拼音结构的度量;第三种方法为改进拼音的字典法模糊集构造方法,此方法对编辑距离计算规则有了更加细致的定义,而且在构造拼音串后会对其进行拼写检查,大大降低了模糊集的大小。仿真实验结果表明,基于通配符的汉字模糊集和基于改进拼音的模糊集构造方法对空间和时间的消耗较低。
其次,基于本文的中文模糊集的构造方法,提出了一个面向中文的高效可验证模糊搜索加密方案。在此方案中,给出的系统模型使数据拥有者和用户都不再承担繁重的计算任务,中文关键词模糊集和索引的构造等都交给私有云服务器来完成,从而提高了整个系统的效率;通过构造了有效的验证算法,验证公有云服务器返回的结果,使得搜索结果具有可验证性。仿真实验结果表明该方案具有高效性,且将基于改进拼音的模糊集构造方法结合在本方案中效率更高。
最后,本文对中文高效可验证搜索加密方案进行了功能扩展。将排序搜索引入到方案中,通过改进的TF-IDF规则,设计出一个支持排序的模糊中文关键词搜索加密方案。该方案使搜索结果更为有效,从而减少了一些不必要的时间和带宽消耗。