基于混合噪声机制和包外估计的差分隐私分类算法的研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:idea0315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
差分隐私保护下的分类算法一直是信息安全领域中备受关注的研究方向,可以在保护数据隐私的情况下对数据进行分类预测,因此在推荐系统、运输信息保护等方面有着重要的应用。但是差分隐私带来隐私保护的同时会严重影响算法的分类预测效果。因此本文围绕差分隐私下的决策树算法和随机森林算法展开了研究,立足于保护数据隐私性的前提下,提高算法的分类准确率。
  首先,针对差分隐私决策树算法在低隐私预算下生成噪声量过大的问题,在决策树算法中引入了解析高斯噪声机制,并通过实验找到其适用范围,进而确立了一种根据隐私预算进行选择的混合噪声机制,以减少决策树中的噪声量,从而提升差分隐私决策树算法的分类准确率,并在此基础上提出了基于混合噪声机制的差分隐私决策树算法。最后通过对比实验验证了此算法的可行性。
  然后,针对差分隐私随机森林算法在对高维数据进行分类时准确率不理想的问题,在随机森林算法中引入差分隐私下的包外估计,通过它来计算决策树权重以及特征权重,然后根据特征权重减少非叶子结点上非重要特征的使用,从而减小噪声,提高决策树分类准确率。同时利用决策树权重在集成时进行提升,使整个随机森林的分类准确率提升。在此基础上提出了一种基于差分隐私下包外估计的随机森林算法。对比实验的结果表明,与现有的差分隐私随机森林算法相比较,此算法具有更好的分类效果,同时具有较好的执行效率。
  最后,将以上两个改进点进行结合——使用基于混合噪声机制的决策树作为随机森林算法中的基本分类器的同时,利用差分隐私下的包外估计进行特征选择和集成提升,从而提出一种高维数据下差分隐私随机森林算法,最后通过实验验证了此算法具有较好的分类能力。
其他文献
伴随着硬件性能的提升以及相关领域的日益成熟,基于RGB-D相机的三维重建技术凭借其高精度、稠密的重建效果,成为了三维重建领域技术革新的关键。在现有基于RGB-D相机的三维重建系统中,输入深度图的质量和形变域估计的精度及效率是直接决定系统性能的关键部分。然而,现有的RGB-D相机获取的深度图普遍存在分辨率低、带有噪声以及深度值缺失等问题,无法提供丰富准确的空间结构信息。同时,针对真实世界中占大多数的
学位
近年来世界各国对临近空间产生了极大的兴趣,临近空间技术得到了迅猛发展。直接序列扩频(DSSS)技术以其良好的抗干扰、抗截获能力在临近空间高动态飞行载体的测控与信息传输系统中展现了巨大的应用前景。临近空间飞行载体所具有的高动态低信噪比的环境特性给高效可靠的扩频接收机设计带来了新的挑战。扩频接收机的关键在于实现对扩频信号的正确解扩,而解扩操作的前提首先要实现接收信号与本地信号载波频率的近似估计和伪码(
临近空间高超声速飞行器所具有的“长时间、高机动、高存活率和高超声速等特点”,使其成为极其适合的的雷达搭载平台。然而,高超声速飞行器在飞行过程中与空气剧烈摩擦,形成等离子鞘套。当高超声速飞行器载雷达进行应用时,特别是进行目标探测时,必须要考虑等离子鞘套对高超声速飞行器载雷达目标探测的影响。雷达信号在等离子鞘套中的传输特性的研究是等离子鞘套下高超声速飞行器载雷达应用的前提与基础。等离子鞘套会对雷达信号
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)能够对感兴趣的观测区域进行高分辨成像,其不受天时和天候的影响,广泛的在军事和民用领域中应用。随着SAR用户对运动目标信息获取需求的增长,地面运动目标指示已经成为SAR系统的一项重要功能,可以进一步提升SAR系统的运动目标信息感知能力。然而,由于探测环境的日益复杂,场景中必然将大量出现快速机动目标,如:道路上飞驰的车辆、战场上高
射频无线能量传输(Radio Frequency Wireless Energy Transfer,RF WET)技术为解决未来通信网络(如物联网)中能量短缺问题的核心技术之一,其核心思想是利用射频信号既可以传递信息又可以承载能量这一双重特性,通过从射频信号中获取能量,从而实现为能量受限节点无线供能。另外,为了满足通信网络的高频谱效率、高能量效率需求,各类高效的无线通信网络架构竞相涌现,如多天线通
有限势博弈作为一类特殊的博弈具有许多优良的性质,特别是纯纳什均衡的存在性和演化下纳什均衡的可达性这两个特性,使它备受青睐.势博弈在博弈理论中占据着非常重要的位置,尤其是在近几年发展的博弈控制论中,作为支付设计和学习规则设计这两个步骤的接口,在分布式系统的优化与控制问题中起着非常关键的作用.本文主要利用势博弈的静态和动态性质,借助矩阵的半张量积这一数学工具,一方面将设备系统等价转化为有限势博弈,从而
学位
浮游生物不仅为海洋哺乳动物和商业上重要的鱼类提供食物,而且通过提供一半的全球初级生产力和对生物地球化学循环做出重大贡献,在海洋生态系统的功能中发挥着根本作用。因此,海洋浮游生物群落结构的变化是一个值得关注的问题。生物上,通过观测海洋测量数据和实验现象发现浮游生物的群落结构受到多种因素的影响。数学建模是分析外在环境变化和内在生理变化对浮游生物生物量影响的一个重要理论方法。通过对浮游生物建立恰当的数学
离群点检测作为数据挖掘技术下的一个重要子项,被广泛应用于网络入侵检测、工业系统故障检测、智能家居系统及医疗诊断等领域。随着数据在规模和维度上的双重增长,如何在大规模多维数据集中准确高效地检测离群点成为一个非常关键且极具挑战性的课题。目前,常用的检测算法如孤立森林(Isolation Forest,iForest)、局部离群因子(Local Outlier Factor,LOF)等由于算法本身的局限
虚拟机迁移作为有效的管理手段被广泛应用于云数据中心,特别是动态迁移技术,其在硬件维护、负载均衡、服务器整合、能耗优化和跨站管理等方面发挥了极其重要的作用。而相关研究中大多都积极地致力于通过虚拟机整合来降低数据中心的能耗,忽略了保证用户服务质量的迁移因子,特别是用户访问虚拟机服务时的访问延迟。访问延迟是现代跨地理区域服务的云数据中心内衡量云服务质量的重要指标,会直接影响到云服务商的市场拓展。因此本文