【摘 要】
:
频繁子图挖掘是频繁模式挖掘的一种具体形式,广泛应用于社会网络分析、生物技术、推荐系统等领域。然而,图数据集中可能包含一些敏感的信息,在挖掘过程中或发布频繁子图信息时都可能造成隐私的泄露。差分隐私不依赖于第三方所掌握的背景知识,具有严格的理论定义和可量化的隐私保护手段,通过调整隐私预算的大小来控制隐私保护的级别,可以应用于数据挖掘领域。差分隐私技术可以保证查询结果不会因为数据集中任一记录的改变而受到
论文部分内容阅读
频繁子图挖掘是频繁模式挖掘的一种具体形式,广泛应用于社会网络分析、生物技术、推荐系统等领域。然而,图数据集中可能包含一些敏感的信息,在挖掘过程中或发布频繁子图信息时都可能造成隐私的泄露。差分隐私不依赖于第三方所掌握的背景知识,具有严格的理论定义和可量化的隐私保护手段,通过调整隐私预算的大小来控制隐私保护的级别,可以应用于数据挖掘领域。差分隐私技术可以保证查询结果不会因为数据集中任一记录的改变而受到显著的影响。目前,能够实现差分隐私保护的频繁子图挖掘算法并不多,而且这些算法难以同时兼顾高可用性与安全性,要么为了实现隐私保护,添加了过量的噪声,挖掘出的结果并不正确,数据的可用性大大降低;要么,隐私保护的力度不够,达不到ε-差分隐私。基于上述问题,本文提出了两个新的满足差分隐私的top-k频繁子图挖掘算法。针对现有的满足差分隐私的top-k频繁子图挖掘算法挖掘结果可用性较低的问题,本文提出了 DP-TGM(Differential Private Top-ksubGraph Mining)算法。算法首先依据挖掘出的频繁点和边对数据集剪枝,然后将频繁的边依次进行扩展挖掘,得到最终的top-k频繁子图。该算法使用一个优先权队列存储临时挖掘到的前k个最频繁的子图,在扩展挖掘的过程中不断更新队列里的元素,并将阈值始终更新为队列里的最小噪音支持度,减少图的扩展次数。算法使用拉普拉斯机制在三个不同的阶段对子图的真实支持度添加噪音,并且采用均分法和特殊级数法对隐私预算进行合理的分配以提高数据可用性。针对在现有基于差分隐私的频繁子图挖掘算法对加权图挖掘的时候没有注意权值保护的问题,本文提出了 DP-FWSM(Differential Private-Frequent Weighted Subgraph Mining)算法。在进行子图挖掘之前,将频繁边筛选出,并对权值加噪,保证了权值的安全,依据频繁边修改原数据集,在子图挖掘的过程中,使用指数机制来挑选子图,同时在发布数据时中使用拉普拉斯机制扰动支持度计数,实现了权值和支持度的双重保护。文章用理论证明了两种算法均满足ε-差分隐私保护,同时,采用对比实验,在不同规模的数据集上验证了算法的可用性。
其他文献
深度学习(Deep Learning,DL)利用深度神经网络学习样本复杂特征的表达,进而解决下游任务,已经在众多领域取得了巨大成功,例如目标检测、机器翻译和自动驾驶等。然而在现实世界中许多数据都以图结构的形式存在,有越来越多的任务需要对这类数据进行处理。常规深度学习方法,例如卷积神经网络(Convolutional Neural Network,CNN),无法直接应用在这类数据上。为了利用深度学习
随着微波技术的发展,微波集成电路在移动通信、毫米波雷达、导航等领域得到广泛的应用。集成电路设计与制造工艺的快速进步,单片微波集成电路尺寸越来越小,电路规模日益增大,功能复杂度也大幅提高,给芯片电磁兼容测试和芯片失效分析带来新的挑战。传统微波近场成像技术由于空间分辨率低、工作频段受限等因素限制已经无法满足芯片测试需求。金刚石氮-空位色心(Nitrogen-Vacancy Center,NV Cent
近年来,量子精密测量作为量子力学的应用之一在测量空间分辨率、灵敏度等方面逐渐超越了传统的测试技术。芯片的集成度和复杂度提高,传统测试技术遇到瓶颈,高分辨电磁场量子精密测量在芯片设计、芯片电磁兼容测试和芯片失效分析上的价值越来越受到重视,基于金刚石NV(Nitrogen-Vacancy)色心的量子精密测量体系因其用户鲁棒性和实用性,受到广泛关注。金刚石NV色心是金刚石中的一种发光缺陷,其具有较长的电
人类的情感是十分丰富的,利用文本数据进行情感分析的研究已经无法满足智能化时代情感分析的需求了,需要引入更多的模态来补充情感信息。因此多模态的情感分析中对每种模态的情感信息的获取成为了一个重要研究。同时,多模态的引入会导致情感分析的效率和资源消耗得到增加,故对情感分析的耗时和内存占用量进行优化也是一个重要的研究方向。本文针对情感分析的效率优化以及多模态情感分析不同模态的信息完整获取展开研究,主要研究
传统的压电式能量收集技术,存在收集方向单一,谐振频率高,转换效率低,输出电压和功率过低的问题。因此本文针对以上问题,提出了一种直角螺旋压电能量收集器和一种圆弧螺旋压电能量收集器。并对这两种螺旋式压电能量收集器进行了数值计算、模型仿真和测试分析。与传统的能量收集器相比,其转换效率,输出电压和功率均可以得到明显改善。本文主要的研究内容如下:(1)介绍了压电能量收集器是把压电能量收集理论作为基础的,运用
量子行走是经典随机行走在量子世界的对应物。基于相干叠加性和量子干涉,量子行走用于实现通用量子计算机、量子通信以及量子模拟。本论文主要讨论离散时间量子行走的基本性质,通过引入量子控制操作实现不同性质行走的相干叠加。通过光学环路结构实现能够精确调控高维量子态的可编程量子行走。主要工作概括如下。量子行走与经典随机行走之间的转变这一研究内容有助于理解量子行走的计算特性,以及与这两种行走相关的动力学。已有的
图像识别技术作为人工智能领域的重要分支,在工农业和公共安全等多个领域被广泛应用。为保证安全生产,降低因作业人员未佩戴安全帽而产生的事故发生率,将图像识别技术应用到安全帽佩戴的实时检查并提高识别准确率,具有显著的工程价值。本文使用卷积神经网络对工作人员是否佩戴安全帽进行检测,主要工作如下:(1)针对在安全帽佩戴检测过程中存在目标较小,检测困难的问题,本文提出了一种基于ASPP(空洞空间金字塔池化)与
移动互联网技术与时空定位技术的快速发展推动了基于位置服务应用的普及。用户基于身份信息与位置信息生成位置证明,并以其为凭证获取位置服务,是当前保证位置服务可靠性的主要方法。传统的位置证明系统采用基于基础设施的位置证明方法,并将位置证明信息在中心化数据库中存储。但是这种方法存在位置证明效率受限于基础设施附近用户分布,以及中心化数据库模式的单点故障问题。本文提出了基于基础设施与附近用户混合的位置证明方法
阵列天线在移动通信、雷达、卫星通信等领域中有着广泛的应用,其中波束赋形是阵列天线的关键技术之一,研究波束赋形技术具有十分重要的意义。近年来,通过智能优化算法针对阵列天线所需的方向图快速实现波束赋形,已经成为研究的热点和重点。本文利用改进粒子群算法实现阵列天线的波束赋形。针对粒子群算法后期搜索能力弱这一问题,本文引入自适应惯性权重以及将粒子群算法与蝴蝶算法相结合这两种思路分别组成了两种不同的改进粒子
Pull Request是GitHub中代码贡献的一种重要方法,当开发人员希望将其代码更改从本地机器合并到存储项目中所有源代码的主存储库时,将提交Pull Request。在将代码更改合并到主存储库之前,开发人员必须请求权限。如果它们的源代码被允许合并,则Pull Request状态显示为被接受。另一方面,如果不允许合并它们的源代码,则Pull Request状态将显示为被拒绝。由于多个因素,例如