【摘 要】
:
在大数据时代,深度学习在图像分类、语音识别、机器翻译等多种任务上取得了令人满意的表现,这与数据的规模、质量息息相关,更多高质量的数据可以使深度神经网络模型的性能得到极大提升。但现实条件下,只有少数机构有能力收集大规模数据,大部分机构只能掌握少量数据。面对专业领域性强、隐私要求高的数据,机构间往往不愿共享数据,且由于受到数据隐私保护相关法律法规的监管,直接传输原始数据难以实施。为了打破机构间的数据壁
论文部分内容阅读
在大数据时代,深度学习在图像分类、语音识别、机器翻译等多种任务上取得了令人满意的表现,这与数据的规模、质量息息相关,更多高质量的数据可以使深度神经网络模型的性能得到极大提升。但现实条件下,只有少数机构有能力收集大规模数据,大部分机构只能掌握少量数据。面对专业领域性强、隐私要求高的数据,机构间往往不愿共享数据,且由于受到数据隐私保护相关法律法规的监管,直接传输原始数据难以实施。为了打破机构间的数据壁垒,参数平均的分布式深度学习算法实现了方式简单的跨机构联合学习,但朴素的模型平均算法存在高额的通信开销、较差的模型表现、数据隐私的间接泄露等问题。本文针对以上问题开展研究,主要贡献如下:1.为了降低通信开销,本文设计实现了基于知识蒸馏的多模型压缩算法。由于模型平均算法的基础是传输模型参数,降低模型规模的大小可以直接提升算法通信效率。该算法以声音事件检测为目标任务,首先确定知识蒸馏过程的各教师模型(表现较优的复杂预训练模型)和学生模型(表现较差的紧凑模型)架构,然后针对任务特点,提出了可以传递时序相关信息的帧级蒸馏方法,最后改进方法为可融合多方经验知识的多模型蒸馏算法。实验结果表明,多模型蒸馏算法可以提供相对教师模型39—53倍的模型压缩比,同时提升学生模型的模型表现。2.为了提升数据隐私保护能力,本文设计实现了基于数据增强的联合学习算法。由于模型平均算法在训练过程中直接传输模型参数,造成了间接泄露数据隐私的隐患。该算法改变朴素模型平均算法训练流程,在本地模型训练前对训练数据进行Mixup混合增强,将经验误差最小化原则扩展为邻域误差最小化,通过改变原始数据分布的方法来提供数据隐私保护。实验结果表明,联合学习算法可以提升多种模型在图像分类、文本分类任务上的表现,且通过在人脸识别任务上进行模型反演攻击实验对比,证明算法可以提升模型对间接数据隐私攻击的防护程度。本文基于模型平均算法,研究了能够降低通信开销的模型压缩技术和提升数据隐私保护能力的联合学习算法,同时两种方法都可以提升模型表现,为跨机构广域网环境下分布式学习提供了可行方案。
其他文献
航天器追逃博弈是当前轨道力学领域的一个研究热点,传统上多采用微分对策来获取追逃双方的最优控制策略,但是这种方法存在求解过程复杂、计算繁琐的缺点,难以满足对抗任务的强实时性要求。人工智能技术发展的不断深入使得利用人工智能实现全部或部分的在线决策成为可能,本文研究了基于深度神经网络和强化学习算法生成空间目标追逃博弈最优控制策略的问题,实现智能、自主、快速的航天器追逃博弈机动轨道在线自主规划。论文的主要
火灾是一种破坏性强、蔓延速度快、难以控制的自然灾害之一,第一时间对火灾进行预警,能够最大限度地减少火灾带来的损失。随着人工智能技术的发展,基于视觉的智能检测技术给火灾预防提供了新思路。相比于传统的检测方法,基于视觉的火灾检测具有监测范围广、可视效果好、预警速度快等优点。火灾发生早期,往往伴随着烟雾的出现,烟雾检测识别显得尤为重要。本文从解决现实存在的烟雾检测问题着手,结合烟雾的静态和动态特征,改进
二维材料优异的光学特性,为突破传统瓶颈,发展新型高性能光子器件提供了可能。本论文以增强和调控光与二维材料相互作用为主线,围绕二维材料光子器件开展了多项原理结构设计,并探索了一系列具有创新性的应用。论文的主要工作如下:1、提出了一种可同时工作在近红外和中红外波段的金属-石墨烯混合结构表面等离激元传感器。该传感器的灵敏度和品质因子不亚于先前所报道的工作。这种混合结构将为未来的多用途高性能折射率传感器提
闭环控制系统是指存在被控的输出以一定方式返回到作为控制的输入端,并对输入端施加控制影响的系统,又称反馈控制系统。由于其可以有效地提高系统的鲁棒性,减小外界因素对系统的干扰,故闭环控制系统在生活生产以及航空航天领域等得到了广泛的应用。闭环控制系统控制领域的一个难点问题之一是对其系统发生故障时的检测与识别。然而,由于闭环控制系统固有的反馈调节机制,使得故障噪声比变小,给闭环控制系统故障检测增加了难度;
在现代声纳系统中,水下目标的自动识别一直是研究的关键技术之一。近年来,随着计算机技术的兴起,基于机器学习的分类识别方法在水声领域得到了应用研究,并取得了良好的效果。与传统单基地主动声纳和被动声纳相比,多基地主动声纳具有自己独特的优点,近年来成为声纳技术的研究热点之一。那么,多基地声纳水下目标识别技术也值得开展相关的研究探索。论文主要研究内容包括:1、水下目标瞬态信号声散射场的数值计算方法与仿真实现
建设海洋强国是全面建设社会主义现代化强国的重要组成部分,海洋大数据作为基础战略资源,是衡量一个国家海洋监管能力的重要标志,随着信息技术的迅猛发展,以卫星海洋遥感数据为代表的海洋数据规模呈现爆炸式增长趋势,海洋研究进入大数据时代,如何收集、管理和挖掘海洋数据是世界各海洋强国研究的重点方向。本文以国防科技大学研制的天拓三号卫星收集的天基AIS数据作为数据支撑,结合机器学习相关算法,从分类、聚类和回归三
尽管现在的强化学习技术比较成熟,但是由于训练过程无任何先验知识,随着任务复杂度提高,训练时间也随之增长,这就限制了强化学习技术应用的任务场景。因此,将相似任务的训练结果作为先验知识模型提供给新的强化学习任务,从而解决强化学习对大量训练样本的依赖问题,提高强化学习算法的可用性和普适性,具有重要的理论意义和实际意义。针对上述研究点,本文开展了以下研究与创新:(1)提出基于先验知识模型的策略迁移方法,降