一种应用粗糙集理论的匿名规则及微聚集算法的研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:jskrrockboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术发展十分迅猛,对各种产业都产生了巨大的影响。各行各业都广泛收集了海量的数据。这些数据中蕴涵大量有用的信息和知识。为从这些收集的数据中获取有用的信息和知识,数据所有人无法避免会发布包含个人信息的数据。这些数据中很可能有适合直接发布的个人隐私信息,未经处理的数据直接发布后将侵犯个人的隐私。因此,怎样发布既真实有效又能保护个人的隐私信息不被泄露的数据成为需要解决的重要问题。传统的匿名算法都是把数据表所有的属性统一处理,采用相同的匿名强度实现k-划分。但是对于高维数据表,传统匿名方法会损失大量信息。本文考虑不同的准标识符属性对敏感属性产生的影响程度是不同的,即重要度不同。因此,本文提出一种基于粗糙集理论的维度划分匿名规则,根据准标识符属性重要度的差别,对准标识符属性进行智能划分。再根据划分结果,对不同的划分进行不同层次的匿名化操作。大量的数据匿名化方法是基于泛化技术。泛化技术在处理高维数据时,会使得数据缺损巨大,实用性低。微聚集算法利用聚类的思想,简单有效。尤其在处理连续型数据时,能保持更多的语义,有着独特的优势。但是微聚集算法主要是针对连续型数据集。本文对其进行改进,提出了面向分类型数据和混合型数据的度量距离公式,并基于其设计了不同的微聚集匿算法,使得能够较好地处理分类型数据集及混合型数据集。本文研究了匿名化后数据的可用性评估模型,并且针对分类型数据,应用粗糙集理论,提出了一种评估数据可用性的模型最后,在通用数据集上进行测试与比较表明:在保证具有相同程度的隐私保护的前提下,本文所提出的改进方法比经典匿名规则具有信息损失量更少,即有效地实现了在保证隐私的基础下提高了数据的可用性。
其他文献
电爆丝喷涂是将电爆炸技术应用于材料表面喷涂的一种新兴的技术,与传统的喷涂技术相比具有独特的优势,如涂层的结合度高且厚度均匀、喷涂速度快等。目前现有的大部分喷涂装置还
中国信息化产业的高速发展对互联网技术创新提出了更高的要求,网络信息的暴涨给舆情挖掘带来了更多的挑战。话题检测与追踪是网络舆情挖掘的重要研究内容,话题检测能够把纷杂
进化计算是指进化规划、遗传算法、和进化策略三者的统称。进化算法已经广泛用于工程控制、函数优化、机器学习等NP难问题的求解上,通过模拟生物进化过程中的杂交变异来保留父
伴随着传感器技术、通信技术和计算机技术的进步,无线传感器网络获得了迅猛发展,应用领域不断拓展,被誉为未来十大新兴技术之首,将对人类的生活和社会生产造成巨大的影响。由于传
很多科学工程计算和数值处理问题可以转化为稀疏线性方程组的求解。对于大规模的稀疏线性方程组的求解,目前使用最广泛且最有效的方法是基于投影的Krylov子空间方法。光滑粒
本文研究了结合AdaBoost和Camshift的视频人脸检测与跟踪算法,针对AdaBoost和Camshift算法的缺点提出了相应的改进算法。首先,研究了基于隐马尔可夫的模型的AdaBoost人脸检测
随着当前无线通信业务的迅速发展,可利用的频带日趋紧张,频谱资源匾乏的问题日益严重。但是研究表明,数量众多的授权频谱在大部分时间处于空闲状态,这种频谱占有状况与利用的不平
自然场景图像中嵌入的文本,是图像高层语义内容的有机组成部分。场景文本有诸多表现形式,如交通标志牌、字幕、商店名称、文本条幅、建筑物额匾等,这些信息可以为场景理解提
粒子滤波算法是一种基于蒙特卡罗方法仿真来实现递推贝叶斯估计的统计滤波方法。作为一种基于蒙特卡罗思想的非线性、非高斯系统滤波方法,粒子滤波在处理非高斯、非线性时变
当前TCP/IP体系结构的互联网存在可扩展性、安全性、移动性等诸多问题,近年来越来越多的网络研究人员投入到未来互联网的研究中。对于所取得的研究成果,研究者可以将其部署在实