敏感数据的智能识别算法及自适应保护模型研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:songking515
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据开放共享阶段对数据进行分析与应用已成为共识,然而数据发布过程通常伴随着隐私泄露,如何自动化识别结构化数据集中的敏感属性并对其分类分级,仍是隐私保护中的难题。本文以属性敏感度量化及属性间关联关系为基础,探讨敏感数据的智能识别算法及自适应隐私保护方案。首先,利用熵的相关定义对属性敏感度进行量化,通过对敏感度聚类和属性间关联规则挖掘,识别敏感属性;其次,通过挖掘敏感属性间的显性互信息相关性和隐性关联关系,对敏感属性进行分类,进一步在模糊综合评价法的框架下,实现敏感属性的分级处理;最后,考虑属性敏感程度的差异性,提出基于属性敏感度的加噪方法,从而制定敏感属性的自适应隐私保护方案。具体研究工作如下:(1)提出了一种结构化数据集的敏感属性智能识别算法。引入信息熵及最大离散熵作为量化属性敏感度的手段,并利用k-means算法对属性敏感度进行聚类分析,进一步通过Aprior算法挖掘属性间的关联规则,实现敏感属性的识别。实验表明,该算法无需预知属性特征即可识别任意结构化数据集的敏感属性,效率和精确率相较其它算法更高。(2)提出了一种结构化数据集的敏感属性分类分级方法。引入互信息度量敏感属性间的相关性,同时考虑敏感属性间的关联关系,实现对敏感属性的分类处理;在模糊综合评价法的框架下,对属性的敏感级别进行评估。对比分析表明,该方法兼顾了属性间的相关性和关联关系,能够更好地解决敏感属性的分类分级问题。(3)在上述研究成果的基础上,设计了一种敏感属性的自适应隐私保护方案。该方案以差分隐私中拉普拉斯加噪机制为研究基础,根据数据集中属性敏感程度的不同,为不同类别的敏感属性分配合理的噪声,从而提出了敏感属性的自适应隐私保护方案。通过实验对比分析,该方案在数据效用和隐私保护程度两方面,比传统的差分隐私加噪方式效果更好,较其它方案更具优势。
其他文献
发动机橡胶悬置系统可以有效隔离发动机产生的振动和噪声,使驾驶员和乘客免受其影响。但是,现代汽车设计趋向于更轻的车身和更大功率的发动机,这两个趋势对于汽车的减振降噪
高核炔银簇合物因其多样的结构以及优异的物理化学性能引起了人们广泛的关注。高核银簇合物的构筑,由于涉及自组装过程和各种复杂因素的共同影响,在制备上十分困难。前期的研究表明,选择炔银聚合物作为前驱体,采用阴离子模板诱导、改变溶剂、调控pH、外围调控配体的引入和改变外围抗衡阴离子的种类等手段,可控制合成一系列结构多样、性能各异的高核炔银簇合物。随着对于高核银簇合物研究的不断深入,通过将某些含有的特定性质
电梯是现代生活的一种垂直交通工具,与人们的日常生活紧密相连,它承载着社会的进步和人们对便捷和智能生活的向往。为了电梯生产商及保养公司的飞速发展,电梯售后服务要有质的提高,电梯售后服务市场保有梯台量才能不断增加。市场在不断增长,需求在不断变化,XD公司能否进一步提高电梯的质量,降低生产成本,竞争中采取市场的优势,把握关键机会,提高电梯的技术含量,是目前面临的困难,只有如此才可以更好地适应市场需求的变
图谱理论是代数图论、组合矩阵论和代数组合论中的一个重要研究领域,它在量子化学、计算机科学、通讯网络等方面都有着广泛的应用.在图谱理论中,星补理论是一个非常重要的研
秸秆炭化避免了秸秆被大量焚烧造成浪费,同时秸秆烟气如不净化处理排放,仍然会带来大气污染等问题。因此本文在分析国内外秸秆烟气净化技术及装备研究现状的基础上,设计了指
宝沃汽车是一家1919年创立于德国不莱梅的汽车制造企业,曾经历过半个多世纪的辉煌,后在1963年因种种原因破产。2015年创始人卡尔·宝沃的后代克里斯蒂·沃先生与北汽福田合作复活这个百年德国品牌,以BX7车型登陆中国市场并将国内市场作为主要的发展方向。2016年后国内汽车市场迎来了寒冬,因为持续的研发投入福田汽车3年亏损40.14亿人民币,令宝沃汽车这一刚刚复兴的品牌发展蒙上了阴影,最终2019年
近年来,沈阳市的城市化速度逐渐加快,社会经济取得了较大进步,但导致沈阳市城市能源消费量呈上升趋势,同时受北方扬沙和风扬尘影响较大,气候相对干燥,全年降水少且分布不均,
在低轨卫星网络逐渐融入下一代网络基础设施的趋势下,面向现有数据业务、以及超高清视频,下一代社交网络,浸入式游戏等未来新型数据业务提供可靠稳定、高吞吐量、低延迟的服务能力成为关键。但是低轨卫星网络中的链路非稳定性以及频繁拓扑切换导致的链路高动态性,使得现有拥塞控制机制难以提供稳定的高吞吐性能、高自适应的传输性能。本文分别针对低轨卫星网络的链路非稳定性、链路高动态性的两个缺点提出如下两种拥塞控制算法:
随着现代互联网技术的发展速度越来越快,人们的生活水平快速提高,移动设备的普及范围也越来越广,许多传统行业的发展都产生了巨大变革,传统的教学方式也需要紧跟时代的发展速度,利用科技的力量减轻教师和学生的压力,让课堂的效率和效果都能够得到提高。因此,将传统课堂与移动互联网相结合,已经逐渐变成现代教学发展必然会选择的道路。当前的传统教学方式中,一些环节比如点名,进行随堂小测试等,在班级人数较多时变得非常耗
对数码相机而言,如果要获得全部的彩色信息,需要经过光学系统分光,投影到三个不同的感光元件上,这样生成的彩色图像没有马赛克现象,但是这种模式的数码相机体积大,不便于携带而且价格昂贵。因此常用的数码相机均采用单感光元件,这种数码相机采样得到的数据仅为全部数据的1/3。利用此采样数据重建完整彩色图像的过程称为彩色图像的去马赛克。传统的全变分正则化方法采用二阶偏微分方程模型,有效保留了彩色图像去马赛克问题