基于本地差分隐私下频繁模式挖掘关键技术研究

来源 :河南财经政法大学 | 被引量 : 3次 | 上传用户:changkou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的快速发展,个人和企业产生了大量的数据信息。为了向用户提供更好的个性化服务,各种社交组织更加热衷于收集和分析用户数据。但是用户数据中通常包含个人敏感信息,直接发布和分析会导致用户隐私的泄露,从而给用户安全带来威胁。保护用户隐私常用的方法有匿名化、数据加密、差分隐私等,但这些方法存在无法防范具有任意背景知识者的攻击问题或者不可抵御来自不可信第三方收集者的攻击问题。为了解决这些问题,出现了本地差异隐私保护模型,该模型能够保证除用户自身外其他任何人无法准确获取用户的真实信息。频繁项挖掘是数据挖掘中的一个重要研究工作,其挖掘结果可以应用到预测商品未来销售趋势等服务当中。针对在本地差分隐私模型下现有的频繁项挖掘技术都是基于简单的单值数据类型上做的,本文在较复杂的键值对类型上进行频繁项挖掘。根据‘键’和‘值’的敏感情况,采用不同的方法进行挖掘。其中当‘键’和‘值’均敏感情况下使用部分扰动和截断来实现更高的挖掘精度。实验结果表明,上述方法在分布精度方面优于竞争对手方法。频繁序列模式挖掘是本文的另一个重要的挖掘对象。对于序列型数据,本文提出了在本地差分隐私模型下使用前缀树结构的LDPFSM频繁序列模式挖掘方法。鉴于该方法的低精度和高通信总成本,本文又提出使用用户分组和采样技术的ILDPFSM法来弥补缺点。在实验中,使用了几种现有的数据扰动方法进行比较,结果表明ILDPFSM方法在挖掘结果的可用性方面优于其他方法。
其他文献
在汉语与越南语词汇里,偏正式复合词占有很大比重,偏正式双音节复合词占大多数。从汉越偏正式双音复合词根与词根之间的关系来看,主要有定中、逆序定中和状中等三种结构形式
目的:探讨1,25-二羟基维生素D3(1,25-dihydroxyvitamin D3,1,25-(OH)2D3)在糖尿病(Diabetes mellitus,DM)防治中的作用。1,25-(OH)2D3通过改善内质网应激(Endoplasmic reticulum stres
威廉·戈尔丁是英国20世纪最著名的作家之一,于1983年获得诺贝尔文学奖,其长篇小说《黑暗昭昭》荣获英国最具声望的文学图书奖詹姆斯·泰勒·布莱克纪念奖。比起寓言,戈尔丁
绳系卫星系统是将两个或多个卫星利用柔性轻质系绳连接在一起的航天器系统,由于其特殊的结构,能够完成传统卫星无法满足的任务需求。基于Golay-3分布的四星绳系闭合系统由四
机体在受到外界条件刺激时(高温、高湿、辐射及一些化学试剂的影响)都会产生大量自由基,自由基的产生会导致氧化应激反应的发生,从而影响动物生产性能,造成畜牧业严重的经济
重粒子碰撞在原子与分子物理、天体物理、等离子体物理和受控核聚变的研究中有重要的研究意义。重粒子碰撞过程包括激发、电离、电子俘获和电子损失等信息,它包含多个分支,如
目的:分析轻度认知功能障碍(mild cognitive impairment,MCI)患者的执行功能(executive function,EF)的量表检测结果,初步分析该认知域的测试结果在健康中老年人与MCI患者之
目的:本研究在验证糖肾方药物作用的基础上,观察糖肾方对糖尿病肾病大鼠肾组织Sirt1、乙酰化NF-κ Bp65的表达及相关炎细胞浸润的影响,探讨糖肾方对糖尿病肾病大鼠肾组织的抗
质子磁力仪是一种高精度标量磁力仪,具有制造成本相对较低、稳定性好、易操作、易携带以及可在较恶劣的环境下工作等优点。目前,质子磁力仪被广泛应用于地球物理研究、考古勘
文本在人机交互中扮演着重要的角色。图片中的文本所包含的丰富而精确的信息在基于视觉的设备中应用非常广泛,能够辅助设备获得更精确的物体和周边环境信息。随着智能机器人、无人驾驶、医疗诊断的飞速发展,文本的检测与识别已经成为定位和理解物体信息的重要途径。特别是近年来,各界学者开始关注图像中遮挡,尺度变化,模糊等形式文本的研究,以解决实际问题。传统的文档图像中的文本检测与识别已经日渐完善,但是文档中的文本通