【摘 要】
:
随着云计算和大数据技术的发展,科学研究和决策对开放数据的需求日益增大,由于数据集中往往包含个人不愿透露的敏感信息,使得隐私保护问题日益突出,成为了阻碍大数据发展的一
论文部分内容阅读
随着云计算和大数据技术的发展,科学研究和决策对开放数据的需求日益增大,由于数据集中往往包含个人不愿透露的敏感信息,使得隐私保护问题日益突出,成为了阻碍大数据发展的一个关键性问题。为保护所发布数据集中个体的隐私,计算机科学领域的研究者开展了对数据匿名化技术的研究。通常,数据匿名化技术首先设定一个匿名模型,接着通过泛化、抑制等手段对原始数据集进行匿名化处理,最后得到满足匿名模型的结果数据集。其中,匿名模型对数据集的特征进行了约束,其主要参数直接或间接地对隐私披露风险进行了限制。针对大数据时代的隐私保护问题,提出一种改进的匿名模型(w,l,k)-anonymity。首先分析了现有匿名模型的缺陷,如k-anonymity没有对敏感属性进行约束,因此无法抵御属性链接攻击。l-diversity与t-closeness均未考虑相同敏感属性中不同敏感属性值的敏感程度差异,对不同敏感程度的属性值进行了相同程度的保护,间接地增加了匿名数据集的敏感属性披露风险和数据效用损失。接着针对基于敏感度分级的匿名模型,总结了p+-sensitive k-anonymity与(p,α)-sensitive k-anonymity在实现机理上的不足,如p+-sensitive k-anonymity基于属性值的敏感度分级,保证了等价类中敏感属性值所属敏感级别的多样性,但是无法避免高敏感度属性值在等价类中的聚集现象。(p,α)-sensitive k-anonymity基于敏感度分级实现了敏感度权重的量化,但是其敏感度量化方式的合理性不足,无法限制等价类的整体敏感度,且不支持对数值型敏感属性值的敏感度量化等。然后针对(p,α)-sensitive k-anonymity的缺陷给出了改进方案,并在此基础上提出一种改进的基于敏感度分级量化的匿名模型。针对(p,α)-sensitive kanonymity在量化敏感度权重方面合理性不足的问题,通过改进分级敏感度权重分配方法,引入了频率敏感度分量并与分级敏感度进行加权,优化了敏感度权重的量化机制;针对等价类元组个数差异对敏感度权重影响较大的问题,通过计算等价类的平均敏感度,限制了等价类的整体敏感度;针对敏感度分级适用范围较窄的问题,通过计算属性值所属分类或区间的频率敏感度,为不易划分敏感级别的分类型属性以及数值型属性的敏感度量化提供了支持。最后基于真实数据集设计实验,从抵御身份披露风险、敏感属性披露风险和数据效用三个方面验证改良匿名模型的有效性。实验结果表明,改良匿名模型进一步降低了数据集的敏感属性披露风险。
其他文献
近几年,随着内蒙古自治区经济、政治和文化的快速发展,求职招聘活动越发频繁,加上我国正处于城市化扩张时期,大量的农村牧区剩余劳动力需要转移到一、二线城市乃至国外,自治
针对目前无线电频谱资源需求日益膨胀的问题,采用频谱感知技术提高频谱资源利用率成为解决的方法之一。本文把感知信号映射到统计流形上,根据感知信号的几何特征对主用户(Primary User,PU)信号进行检测。首先,介绍了频谱感知技术的研究背景及研究现状,并汇总了单节点频谱感知与协作频谱感知的应用特点。信息几何理论作为应用到频谱感知的方法,在这里介绍了信息几何中的黎曼度规、测地线距离,黎曼梯度等概念。
化学图论是图论的一个重要分支,其主要是将一些有机化合物的分子结构图模拟为图论中一般的连通图,进一步用数学的方法对这些模拟图进行结构的分析和研究,从而得到这些有机化合物的某种性质.拓扑指标作为化学图论的主要研究内容之一,是从分子的结构图中以确定规则导出的数值.这些数值是图形不变量,通常反映分子的某种性质.拓扑指标建立起分子结构与分子性质之间的桥梁,在理论化学,应用化学,以及药理学,生物学等研究中有着
历史认识问题一直是日本与邻国是否能够实现真正和解,走向和平发展道路的主要原因。而日本首相的战后周年谈话则是历届执政内阁对历史问题的立场、态度的官方表态。目前国那
人口老龄化的进一步加剧给我国养老服务体系带来巨大挑战,基于社区开展的为老助餐配餐服务,成为社区居家养老的托底工程。本研究目的是通过SAPAD理论框架,对广州市当前开展的社区长者饭堂助餐配餐服务进行研究分析,洞察用户需求并输出设计机会,以此重构具备友好体验的服务系统,同时将SAPAD理论框架运用到社区为老饮食服务领域中。基于文献法和预调研,选取助餐配餐服务中过往研究较少、体验问题明显、且涉及多个利益
对于道路的学习和识别是无人驾驶中重要的一环,目的是通过车载相机采集到的道路图片来得到无人车的转角和速度信息。随着深度学习的发展,卷积神经网络在计算机视觉领域取得了显著的成效。当前,在无人驾驶领域利用深度学习提取道路信息成为路径学习技术的主流。针对路径学习主要有车道线的检测识别和整体道路方向的识别,本文利用深度学习技术,把摄像机拍摄到的整个图片作为输入来分析得到道路信息,继而帮助无人车做转向决策,完
HINOC2.0是我国拥有自主知识产权的宽带接入技术,能够充分利用现有的覆盖广泛的有线电视网络,为用户提供吉比特的高速宽带接入。2016年3月,HINOC2.0作为广播电视行业标准正式
研究目的:本研究在抗阻力量训练的动作节奏中加入不同时长的顶部停留阶段,来探究这种节奏训练方法对功率输出和力竭次数的即刻影响,为力量训练中最大功率法和极限次数法的应用提供理论支持,提高训练计划制定的精细化程度。研究方法:选取11名北京体育大学体能训练学院男性大学生作为受试者,采用3种不同的动作节奏,分别为:2/0/快/0(2s离心,无底部停留,快速向心,无顶部停留);2/0/快/3(2s离心,无底部
双主肋梁斜拉桥常用于双索面混凝土斜拉桥。由于双主肋梁斜拉桥桥面薄而宽,剪力滞效应明显。本文以仙桃汉江大桥为工程背景,建立有限元模型,对成桥状态下桥面结构横坡、桥面板厚度和横隔板对双主肋梁斜拉桥剪力滞系数的影响。论文所做的工作内容主要包括以下几个方面:(1)对国内外剪力滞研究的发展重要节点进行概述,从剪力滞理论研究、剪力滞影响因素和剪力滞效应对主梁结构的影响三个方面的研究对剪力滞效应研究进行说明。(
本文构建了一种在现场可编程门阵列(field programmable gate arrays,FPGA)平台实现微弱信号检测的系统。本系统采用杜芬混沌算法对淹没在强噪声下的微弱正弦信号进行检测并