论文部分内容阅读
针对传统匿名算法采用相同的匿名强度实现k-划分,常导致所要发布数据的隐私保护程度与数据可用性之间失衡的问题,提出一种基于粗糙集属性重要度的多约束匿名化方法。根据准标识符属性重要度的差别,对准标识符属性维度进行自动划分,实现多约束匿名参数的设计,对具有不同维度的划分进行相应的匿名化操作。基于粗糙集理论和信息熵理论,设计了一种分类型数据可用性评估模型。从数据泛化后的信息损失、等价类对集合划分导致的信息熵改变两方面综合评估匿名化数据表的信息损失量。实验结果表明,采用该方法能够较好地实现数据的隐私保护和数据可用性