论文部分内容阅读
K-匿名技术是信息共享中保护隐私信息安全的重要方式,经过K-匿名处理的共享数据能够有效的防止相关链接攻击,避免隐私信息的泄露。首先,本文根据信息共享中隐私保护的不同对象,分别对面向原始数据的隐私保护与面向数据挖掘知识的隐私保护进行了总结分析。介绍了K-匿名隐私保护模型的相关研究背景,以及实现技术,并通过实例描述了K-匿名模型。其次,对前人的一系列研究成果进行了研究分析,在K-匿名技术的主要实现算法全域泛化算法与局域泛化算法中,分别对一些比较经典的算法的性能进行了比较分析,分析现有K-匿名算法的优点与缺陷。并对K-匿名隐私保护模型有可能受到的各种攻击进行了理论研究分析,本文提出了针对K-匿名隐私保护模型的五种攻击方式,通过实例进行描述,并提出了一系列解决方案,为防止针对K-匿名隐私保护模型的攻击提供有力的保障。然后,分析了K-匿名隐私保护模型的主要实现方法隐匿与泛化,并研究了不同的泛化处理方式对于匿名化数据的精确度影响差异。将熵的思想引入K-匿名隐私保护模型,提出了基于熵分类的K-匿名隐私保护算法Entropy算法。本文通过实验验证了Entropy算法的性能情况,并且根据实验数据对Entropy算法进行了时间复杂度分析以及匿名化数据的精确度分析,实验表明该算法在前人提出的算法基础上进行了有效的改进。最后,在相同的实验环境下,通过实验验证了本文提出来的Entropy算法与前人提出来的全域泛化算法Basic Incognito算法的性能情况。根据实验数据结果,对Entropy算法与Basic Incognito算法的性能进行了比较分析,包括时间复杂度分析以及精确度分析。分析结果表明,虽然Entropy算法在运行时间方面较Basic Incognito算法需要更长的时间,但是Entropy算法却很好的保证了匿名化数据的精确度,在确保共享数据满足K-匿名要求的同时,有效的提高了匿名化数据的参考利用价值。