基于事务截断的差分隐私频繁项集挖掘方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:guocheng19896230801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网、云计算、大数据等信息技术的快速发展,如何通过数据挖掘获取潜在有价值的知识成为当前的研究热点。其中,频繁项集挖掘是发现事务关联关系,提供推荐、预测等信息服务的基础,在电子商务、医疗健康、位置服务等领域具有广泛的应用需求。但是当频繁项集挖掘的数据对象中含有用户敏感信息时,直接挖掘和发布频繁项集及其支持度存在泄露用户敏感信息的风险,这在一定程度上制约了频繁项集挖掘的相关应用,因此有必要对频繁项集的挖掘和发布加以隐私保护。差分隐私保护采取数据失真技术,通过向查询请求或发布结果中添加噪音实现隐私保护。该模型虽然提高了隐私保护水平,但是对输出结果的可用性与准确性产生一定的影响。基于差分隐私的频繁项集挖掘已经取得了一系列成果,但仍然存在两个主要问题,即如何保证该方法满足?-差分隐私保护,以及如何提高所发布频繁项集及其噪音支持度的可用性与准确性。针对上述问题,本文分别提出了基于事务截断的差分隐私频繁项集挖掘算法与基于线性回归的噪音支持度调整算法。由于数据集的事务长度会影响所添加噪音的大小,基于事务截断的差分隐私频繁项集挖掘算法利用指数机制的隐私性与寻优能力,同时考虑减小噪音误差与截断误差的总和,将最优事务长度选取问题转换为用质量函数求最优解的问题,并截断原始事务数据集。然后用FP-Growth算法对截断后的事务数据集进行频繁项集挖掘,利用拉普拉斯机制将产生的噪音添加至频繁项集及其支持度中,以此提高挖掘结果的隐私保护水平。基于线性回归的噪音支持度调整算法主要是调整最终输出的top-k频繁项集的噪音支持度,使其具有真实支持度序列的降序和整数性质,从而提高所输出频繁项集的准确性。实验表明,利用基于事务截断的差分隐私频繁项集挖掘算法与基于线性回归的噪音支持度调整算法能够有效提高top-k频繁项集及其噪音支持度的可用性与准确性。同时,理论分析表明该方法能够满足?-差分隐私保护和(δ,η)-useful可用性的要求。
其他文献
恶性黑素瘤是恶性程度很高的皮肤癌,临床化疗效果很差,由于肿瘤恶性程度高且多发、易转移,患者5年生存率很低。三氧化二砷(arsenic trioxide,As2O3)是中药"砒霜"的主要成份,
会议
近年来,以图像作为载体的隐写研究比较成熟,对隐写术的贡献突出,图像隐写主要围绕感知度、安全性和嵌入容量三大指标进行设计,但感知度、安全性、嵌入容量之间存在抗衡的关系
本论文在基于P.J.Brockwell提出的带一致突变生灭过程的模型之上,研究了该过程的灭绝概率、灭绝时间以及衰减参数。第一章阐述了带突变生灭过程的发展背景、现状及本文研究的带一致突变生灭过程的创新点。第二章描述了相关理论–马尔可夫过程、生灭过程、单生过程、拟平稳分布以及衰减参数。第三章首先介绍了模型一的基本结构,其次利用简单的方法解决了模型一以概率1灭绝的充要条件,并且重点讨论了平均灭绝时间有限
荒漠草原地区原本无林或者少林,近60年通过植树造林、防风固沙、退耕还林等工程,建设了大量的片林,科学评价他们的生态功能和效益是有效保护和合理建设片林的依据。本研究旨在通过对宁夏盐池县荒漠草原不同面积大小榆树和杨树片林鸟类群落结构的调查,鸟类分类,以及片林树种和面积大小对鸟类停歇的影响,评价他们的生态功能。调查于2018年7月至2018年10月进行,在盐池县北部荒漠草原地区的皖记沟村和沙边子村,选择
随着自动化、计算机等各种技术的不断发展和应用,无人机的技术更趋智能化,结构日趋复杂,功能也更为强大。随着无人机可承担任务越来越广泛,其面临的应用环境也越来越具有非合作性、多不确定性因素、高威胁性、动态化等特点。这对无人机的指挥控制提出了更高的要求,传统的基于地面指控站遥控或基于程序化的自动控制策略已经很难适应未来无人机的任务需求。无人机根据任务要求和实时的战场环境,自主地进行任务规划和决策成为未来
研究目的:以“筋为骨用”理论为指导,以社区膝骨关节炎(Knee Osteoarthritis,KOA)患者为研究对象,运用中医推拿、点穴、中药熏洗联合塞来昔布胶囊为干预手段,观察其临床疗效,
肠球菌(Enterococcus)是一种兼性厌氧性革兰氏阳性菌,属于人和动物肠道内的共生细菌,现已成为主要的机会致病菌。在肠球菌属中,粪肠球菌和屎肠球菌可导致人类和动物的许多感
西藏斯弄多Ag-Pb-Zn矿床大地构造位置位于西藏冈底斯成矿带南缘弧背断裂带上,赋存于林子宗群火山岩中。研究中综合运用了短波红外和岩石地球化学勘查的方法,通过对矿区内不同类型矿体典型钻孔进行测量,厘定了蚀变矿物组合,基于元素迁移量计算的结果,系统分析了蚀变过程中元素的迁移特征,探讨了成矿机制。野外钻孔编录发现,矿体硅化较强,在钻孔中发现隐晶质、石英脉和以石英集合体形式存在的不同赋存状态下的石英。根
对马尔可夫链的理论研究通常是基于转移矩阵已知这个自然的假设的。然而在现实系统中,马尔可夫链的转移矩阵可能是未知的,甚至可能是需要通过部分可观测的数据来确定的。因此,如何通过部分可观测的信息来确定马尔可夫链的转移矩阵这个课题在应用中具有重要的意义。这就是我们说的马尔可夫链的统计确认问题。充分利用马尔可夫链的本质特性和矩阵分析方法,找到某个状态集的生存时间和死亡时间分布与转移矩阵之间的约束关系,再根据
目的:了解我院采用光动力治疗的尖锐湿疣患者的基本情况,探究疗效的影响因素,进一步提高疗效。方法:统计2016.01-2017.08期间确诊于滨州医学院附属医院皮肤科门诊和性病门诊