论文部分内容阅读
基于隐私保护的数据挖掘是近年来数据挖掘领域的研究热点之一.提出一个基于数据清洗的敏感序列模式隐藏算法,它通过计算事务组影响权值,选取对非敏感序列模式影响最小的事务组进行清洗,从而在确保隐藏敏感序列模式的同时,尽量减少对非敏感模式集的影响.对不同稠密度和不同规模数据集的实验结果表明,该算法既实现了对敏感模式的保护又具有较低的误隐藏率,并且当数据集大小变化时,序列数据库相异度没有明显改变.