k-匿名关系模型及相关理论问题研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:forgetyouba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
k-匿名隐私保护模型已经成为数据发布者可信的隐私保护模型。然而,受隐私保护要求的制约,即使最优的k-匿名算法,产生的数据也将十分不精确,正因为这种不精确导致了数据可用性的降低,数据接受者往往将其当作垃圾数据而拒之门外。为了使数据接受者和管理者能够更好地利用k-匿名隐私保护模型中的数据,本文从另外一个角度来研究k-匿名数据,即把k-匿名数据看成是一种不确定性数据,用不确定性的方式来表示和研究它。不确定性关系根据属性取值扩展原理将经典确定性关系模型中每个元组的属性取值其可能性由仅含有一个值扩展为值的集合,这种扩展给不确定性关系模型带来了新的数据完整性约束要求。数据依赖是对属性间取值进行关联的一种完整性约束条件,函数依赖是一种对数据库模式设计及查询具有重要影响的数据依赖。对于不确定性关系,由于一个元组中属性取值存在多种可能,属性间取值相互约束的情况要比确定性关系中的复杂。描述不确定性关系的模型有以下几类:1.tuple-ors,2.attribut-ors,3.C-tables,4.pNF2,5.Sprop,6.Sattr,7.Stuple,8.S2。目前,只有基于tuple-ors模型上的函数依赖及推导规则,但在tuple-ors模型没有关系模式的定义,无法在其上利用函数依赖指导不确定性关系进行规范化设计。不确定性关系表示的模型不同,函数依赖的形式和性质也不同。本文选取pNF2为描述不确定性关系的模型,提出了两类函数依赖,并证明了其推导规则正确性和完备性。本文提出的两类局部函数依赖,可以在不确定性关系规范化设计中,检查出该设计是否存在不满足基本的第三范式要求的情况。本文最后探讨了k-匿名这种特殊的不确定数据中存在的数据依赖及k-匿名关系模型。为了研究这种k-匿名数据中的数据依赖问题,本文将经典函数依赖中被决定属性取值相等这个条件进行扩展,使其取值来自同一个指定集合,同时又不同于多值依赖中被决定属性其取值与非该依赖中的属性无关的约束,提出了一种扩展函数依赖。扩展函数依赖不仅包括经典函数依赖、垂直函数依赖、水平函数依赖、度量函数依赖的特性,而且可以从数据完整性的角度来描述k-匿名这种不确定数据的约束条件及指导k-匿名隐私保护模型中准标识符的选取。在扩展函数依赖的基础上,本文增加约束条件,即k-匿名关系表中准标识符相等的元组个数必须大于等于k,提出了k重扩展函数依赖,并讨论了如何利用k重扩展函数依赖检查在更新k-匿名关系表时是否存在异常。
其他文献
随着网络和信息技术的发展,很多的企业和部门已经积累了大量、使用不同数据库管理系统、以不同形式存储的数据。当前,在解决异构数据集成的问题上主要有联邦数据库、数据仓库、
互联网的普及和高速发展,使得网络上的电子文档迅速增加,但是给用户带来大量信息的同时,使得用户查找、过滤和管理这些海量信息非常困难。因此,文本分类技术的研究引起了人们的持
针对传统 C4.5 决策树算法在处理含有大量噪声和多值属性的大型复杂数据库中的多维度数据集分类问题时决策树分类响应时间长、准确度低的问题,提出了一种新的剪枝算法—CDC算
公司或组织为了在遗留系统的基础之上,进行业务需求变更带来的持续迭代和改进,或者实现向新系统的迁移,并降低这一过程可能引起的不可预期的副作用,比如业务丢失等,需要仔细
近年来,信息技术高速发展,海量的文字、图片、音频、视频等数据随之产生,大数据的研究亦随之引起广大学者重视,其中分布式数据库的研究就是热点之一。在分布式数据库中查询是最频
网络摄像头应用的不断拓展,使其不仅在娱乐领域,在更多的专业领域都有着独特的应用,这样的背景下开发网络摄像头应用软件的需求也不断增多。如何快速开发出质量好、功能完善
随着全业务运营的到来,各运营商对市场和客户的争夺越来越激烈,而为企业贡献较高价值的中高价值客户,由于其对企业服务能力与业务特征相对最了解,也成为了各大运营商抢挖的对象。
版本控制软件是软件开发和管理过程中必备的工具,近几年托管型的版本控制软件服务越来越流行。版本控制软件一般分为三个模块:服务器,软件开发工具配套的插件,以及配置管理工
本文针对一种新型的字符二维条码图像进行识别研究。与传统图形二维条码的符号结构不同,字符二维条码由英文字母组成,故在识别过程上也有很大的区别。本文主要针对课题组研究
多投影技术在许多领域得到了广泛的应用,但多投影系统的构建以及维护过程复杂。投影仪位置的临时变动需要打断连续的展示过程对系统进行二次校正,展览过程中灯光以及环境光的