数据发布中多敏感属性数据隐私保护方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:wreck2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机网络技术快速发展的大背景下,互联网为了给人们带来越来越大的便利,大量收集用户的各方面信息。由于互联网的开放性,导致用户信息共享也变得越来越简,同时用户个人敏感信息发生泄漏的风险大大增加。为了进行数据挖掘,数据研究科研,在某些情况下数据拥有者需要在互联网上发布包含用户个人信息的数据集,这种情况下的信息共享更容易造成用户个人的隐私信息泄露。因此,在这些数据发布机构发布数据之前需要对原始数据集采取一定方式隐藏用户的身份以保护敏感信息,数据发布中的隐私保护也成为隐私保护领域的主要研究内容,其主要目标是对发布数据在保证用户信息的隐私不被泄露的同时尽可能地提高发布数据的可用性,实现高效安全的信息共享。在数据发布的实际应用中,通常面临的情况是数据集包含多敏感隐私属性,并且针对敏感信息需要进行个性化保护,因此多敏感属性隐私保护及个性化发布是当前数据发布中的研究热点,本文重点分析了现有的基于多维桶技术和利用L-覆盖性聚类方法的多敏感属性数据发布方法,并提出了一种新的基于类二部图边选择的分组算法(BES),并通过实验证明了BES算法的有效性。本文继续分析了在多敏感属性个性化数据发布的情况下,现有的加权多维桶分组算法(WMBF),最小选择度优先分组算法,完全(α,k)-anonymity模型等均存在敏感度高的元组划分到同一等价类分组中,造成隐私属性值倾斜,容易受到同质攻击的问题,并且制定个性化方案时只考虑了敏感属性值的敏感度而没有综合考虑敏感属性自身的敏感度问题。因此本文在综合考虑敏感值和敏感属性自身敏感度的基础上,为避免发布数据中同一分组隐私属性值倾斜,在L-多样化模型的基础上提出(L,α)-diversity个性化匿名模型,针对该模型实现加权的基于类二部图边选择分组算法(WBES)和其改进算法L-拆分元组边选择分组算法(L-SWES)。实验结果表明本文提出的算法能有效避免同质攻击,并且能够得到较好的数据发布效果。且分组算法在执行时间上不受敏感属性维度的影响,保持比较好的算法效率。
其他文献
针对互联网评论文本中观点句情感特征的稀疏性及低频性,提出一种基于概率潜在语义分析(PLSA)模型的观点句聚类算法。利用PLSA对语料库中的观点句进行数据预处理与数据聚类,并
<正>随着我市《以学为主,当堂达标》教学课程改革的不断深入,我的教学理念也在不断更新。在课堂实践中,我慢慢领悟了,教学改革最为核心和最为关键的环节就是促进学生学习方式
目的 研究应用AO微型钢板内固定治疗手部骨折的疗效。方法 对手部掌、指骨骨折 2 3例 30处行切开复位 ,AO微型钢板内固定治疗。结果 术后外固定时间为 2~ 3周 ,随访 2~ 10个
目的:探索冼绍祥教授治疗慢性心力衰竭的用药规律。方法:收集冼绍祥教授门诊治疗慢性心力衰竭处方,运用中医传承辅助平台构建数据库,使用关联规则、改进的互信息法、复杂系统
本文主要对微波辐射辅助提取食用枸杞粉末和提取最佳工艺进行研究。取得的主要研究成果如下:加入一定料液比(1:8、1:10、1:12)的水溶液,放入微波搅拌器中放置一定时间(40-100
近年来,高职新教师的职业幸福感越发引起关注。以提升高职新教师职业幸福感为目标,将职业幸福生态圈与职业生涯规划相结合。围绕职业幸福生态圈中四个相互影响的分项指数,即
随着移动互联网技术的飞速发展,MOOCS与网络教育的发展方兴未艾。移动互联网学习有很好的便利性,选学人数不断增长,因此保证网络教育的质量尤为重要。质量主要包括网络开放课
目的 观察散瘀巴布贴治疗急性踝关节扭伤的临床疗效和皮肤刺激反应,评估散瘀巴布贴治疗急性踝关节扭伤临床疗效及副作用,将为其研发推广提供临床依据。方法 将64例符合纳入标