论文部分内容阅读
k-匿名隐私保护模型已经成为数据发布者可信的隐私保护模型。然而,受隐私保护要求的制约,即使最优的k-匿名算法,产生的数据也将十分不精确,正因为这种不精确导致了数据可用性的降低,数据接受者往往将其当作垃圾数据而拒之门外。为了使数据接受者和管理者能够更好地利用k-匿名隐私保护模型中的数据,本文从另外一个角度来研究k-匿名数据,即把k-匿名数据看成是一种不确定性数据,用不确定性的方式来表示和研究它。不确定性关系根据属性取值扩展原理将经典确定性关系模型中每个元组的属性取值其可能性由仅含有一个值扩展为值的集合,这种扩展给不确定性关系模型带来了新的数据完整性约束要求。数据依赖是对属性间取值进行关联的一种完整性约束条件,函数依赖是一种对数据库模式设计及查询具有重要影响的数据依赖。对于不确定性关系,由于一个元组中属性取值存在多种可能,属性间取值相互约束的情况要比确定性关系中的复杂。描述不确定性关系的模型有以下几类:1.tuple-ors,2.attribut-ors,3.C-tables,4.pNF2,5.Sprop,6.Sattr,7.Stuple,8.S2。目前,只有基于tuple-ors模型上的函数依赖及推导规则,但在tuple-ors模型没有关系模式的定义,无法在其上利用函数依赖指导不确定性关系进行规范化设计。不确定性关系表示的模型不同,函数依赖的形式和性质也不同。本文选取pNF2为描述不确定性关系的模型,提出了两类函数依赖,并证明了其推导规则正确性和完备性。本文提出的两类局部函数依赖,可以在不确定性关系规范化设计中,检查出该设计是否存在不满足基本的第三范式要求的情况。本文最后探讨了k-匿名这种特殊的不确定数据中存在的数据依赖及k-匿名关系模型。为了研究这种k-匿名数据中的数据依赖问题,本文将经典函数依赖中被决定属性取值相等这个条件进行扩展,使其取值来自同一个指定集合,同时又不同于多值依赖中被决定属性其取值与非该依赖中的属性无关的约束,提出了一种扩展函数依赖。扩展函数依赖不仅包括经典函数依赖、垂直函数依赖、水平函数依赖、度量函数依赖的特性,而且可以从数据完整性的角度来描述k-匿名这种不确定数据的约束条件及指导k-匿名隐私保护模型中准标识符的选取。在扩展函数依赖的基础上,本文增加约束条件,即k-匿名关系表中准标识符相等的元组个数必须大于等于k,提出了k重扩展函数依赖,并讨论了如何利用k重扩展函数依赖检查在更新k-匿名关系表时是否存在异常。