数据发布中多敏感属性数据隐私保护算法

来源 :广西大学 | 被引量 : 0次 | 上传用户:wangxd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,如何在保证隐私数据安全的同时提高计算机信息系统发布数据的可用性,已成为当前计算机系统安全领域面临的挑战问题之一。本文针对静态、动态环境下数据发布中敏感信息泄露的问题进行研究,主要研究针对多敏感属性数据集的基于k-匿名模型的概率k-匿名改进算法和基于m-不变性匿名模型的改进算法的设计与实现。  基于k-匿名模型的要求,研究提出适用于静态多敏感属性数据集的基于变长聚类的概率k-匿名算法,该算法在原始概率k-匿名算法基础上,综合考虑距离和权重值对聚类种子选取以及聚类结果的影响,建立一个新的聚类种子选取模型,以获得更好的聚类结果,提高匿名数据集的数据质量;提出融合k-means与变长聚类算法的概率k-匿名并行算法,采用多线程并行技术,在不降低匿名质量的前提下,大大提升算法处理大数据集的效率。实验结果表明,所提出的算法效率高、生成的匿名数据集具有较高的数据可用性。  针对动态数据集环境下隐私泄露的问题,对经典算法m-invariant算法进行分析研究并提出改进算法,改进的算法通过增加一个伪记录表,将新添加的记录先与伪记录进行匹配,创造删除伪记录的机会,以减少整个匿名数据集中伪记录的总数目,达到提高数据可用性的目的;针对算法处理多敏感属性数据较耗时的问题,采用多线程并行技术,将算法的桶分割并行处理,在不降低数据质量的前提下,提高算法的效率。实验表明,提出的改进算法高效、生成的匿名数据集具有较高的数据可用性。
其他文献
随着网络信息技术的蓬勃发展,网络生活已成为人们生活中的一部分,计算机自动识别语义能让计算机给人提供更好的服务,因此,计算机自动识别语义已经成为广大学者关注的焦点。但
随着多媒体技术和信息技术的迅速发展,视频技术作为多媒体技术中的重要元素获得了更多关注。为了使视频传输更快,提出了视频压缩技术。H.264作为当今应用最广泛的视频压缩编码
无线传感器网络(Wireless Sensor Networks, WSNs)作为物联网底层支撑技术受到全世界关注。不同于其他无线网络,无线传感器网络中节点通常由电池供电,能量受限,所以提高无线传感
当前技术协会组织网站停留于Web1.0网站单向信息发布的模式,缺乏成员间交互渠道,不能满足协会组织内各种角色成员进行充分而又广泛的思想和信息交流探讨的需求。为此,本文在
目前,人体活动识别技术大都局限于仅使用加速度对人体运动进行识别,融合异构传感器数据进行复杂活动识别的研究很少,现有的一些融合加速度和心率进行活动识别的工作,也仅仅是在特
重庆地处中国的西部,是一个多山多河流的城市,桥在这座城市发展中起到了举足轻重的作用,桥梁的健康直接影响到城市的经济发展及人们的日常生活,所以桥梁的健康监测成为了城市建设
现如今,互联网的发展突飞猛进,遍布日常生活中的各个角落,给人们的生活带来了巨大的便利。而如何在互联网的汪洋大海中获取用户想要的信息,搜索引擎无疑是一个方便可靠的工具
近些年来,软件技术得到了长足的发展,用户对软件系统的需求也越来越高,针对用户提出各种各样新的需求和系统运行环境的改变,用户希望软件系统可以在运行状态下,并不用对软件
论文设计开发了一套矿山设备布置图系统,课题来源于生产实际,针对某矿山设备管理需求进行研究开发。课题对矿山企业的设备管理实际需求进行评估、确认,并结合该矿山企业的设备管
深层网络指的是位于表层网络之下所隐藏的数据,需要用户填写表单发送查询请求才能获取,其数据量远远超过表层网络且信息价值巨大。由此原因,如何挖掘出位于深层网络中的海量数据