基于信息增益比例约束的数据匿名方法及其评估机制

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:andychinajj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对数据发布中的隐私泄露问题,分析了对数据集进行匿名保护需要满足的条件,提出了一种基于信息增益比例约束的数据匿名方法。该方法以凝聚层次聚类为基本原理,将数据集中的元组划分到若干个等价群中,然后概化每个等价群中的元组使其具有相同的准标志符值。在聚类过程中,以信息损失最小、信息增益比例最大的约束条件来控制聚类的合并,可以使数据匿名结果保持良好的可用性和安全性。对匿名结果的质量评估问题进行了深入的探讨,提出了匿名结果可用性和安全性的量化计算方法。在UCI知识库提供的Adult数据集上的一系列实验结果表明,该方法
其他文献
根据样本单元的区间投入、区间产出定义最大样本生产可能集,建立基于最大样本生产可能集的广义超效率区间DEA模型,然后定义了待评价决策单元基于广义超效率区间DEA模型的超效
In order to archive,quality control and disseminate a large variety of marine data in a marine data exchange platform,a marine XML has been developed to encapsu
随着大学生就业的逐渐社会化和市场化,加强大学生就业困难群体的就业援助成为促进大学生充分就业的根本途径.实践中,大学生就业困难群体援助是一项复杂的系统工程,关键是要建
研究超高压体系中,压力、温度、保压时间和pH对猪胰脂肪酶稳定性的影响.结果表明:压力、温度、保压时间和pH是影响猪胰脂肪酶稳定性的重要因素.在压力110 MPa、温度小于37℃
财产权与公民权从经济与政治两个方面规定了人权的基本结构,既体现了人们在经济领域的地位,同时也规定了公民在政治领域内的基本资格。现代西方人权的基本结构反映了两者之间
汶川Ms8.0级地震发生在青藏高原东缘著名的龙门山断裂带上,造成了中央断裂和前山断裂共约330km的地震地表破裂带.初步研究表明,龙门山断裂带上大震复发可能属特征地震模式.结
从本质上看,贸易摩擦是国家间利益冲突激化的结果和表现。当前互利共赢的内涵已经从传统意义上依托比较优势获取贸易利益,演变为国家间利益呈现彼此相依的“共生性”和“包容
由于受拉尼娜事件影响和大气环境的持续异常,我国南方出现罕见低温雨雪冰冻天气,造成大面积森林资源破坏。本文重点分析了林业受损状况,提出了森林资源资产损失评估原则、思
2008年6月1日,颁布施行一周年,作为地方性配套法规,也于2008年6月1日起施行.广西壮族自治区水文水资源局将从六方面加强条例的贯彻落实工作,加快推进广西水文事业现代化建设,
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7