【摘 要】
:
目前,大量的有标签数据是训练深度神经网络的必要条件。在一些现实场景中,如医院、学校等场景,通常只有少量有标签数据,这时我们需要采用域适应技术将模型从有标签数据的源域转移到目标域从而处理这些无标签数据。在这个过程中,经过训练的模型不可避免地被暴露给目标用户,导致一个用户的数据可能被另一个用户窃取。因此,域适应过程的隐私保护是一个至关重要的问题。然而,由于隐私细节可以被编码到深度神经网络的不同阶段中,
论文部分内容阅读
目前,大量的有标签数据是训练深度神经网络的必要条件。在一些现实场景中,如医院、学校等场景,通常只有少量有标签数据,这时我们需要采用域适应技术将模型从有标签数据的源域转移到目标域从而处理这些无标签数据。在这个过程中,经过训练的模型不可避免地被暴露给目标用户,导致一个用户的数据可能被另一个用户窃取。因此,域适应过程的隐私保护是一个至关重要的问题。然而,由于隐私细节可以被编码到深度神经网络的不同阶段中,这给隐私保护方案设计带来了极大的挑战。本文首次尝试探讨当训练数据集包含敏感信息时,域适应算法的隐私脆弱性。本文首先提出了一种新的针对域适应算法的成员推理攻击(简称为Mi DA),用来推断目标域中记录的成员归属信息。通过在域适应任务中利用来自源域的额外背景知识,我们可利用源域与目标域之间的相似特征分布,高效准确地确定给定记录是否是训练数据集中的成员。值得特别注意的是,本文所提出的方法可以部署在实际的场景中,即假设以黑盒的形式访问域分类模型。本文在两个真实的数据集上进行了广泛的评估。实验结果表明,所提攻击方案能够在较高的攻击成功率下实现对域适应模型的成员推理攻击。为了解决域适应算法的隐私泄露问题,本文同时提出了一种新的差分隐私保护的域适应框架(简称为DPDA),它可以同时实现域适应技术和隐私保护。具体来说,本文利用对抗损失来完成域适应任务,并利用差分隐私技术将隐私保护机制嵌入到特定的层以及训练过程中。虽然通常来说差分隐私技术对深度神经网络的性能会造成一定影响,但我们仍然可以提高无标签目标域数据的分类准确率。通过在基准数据集的广泛评估,实验结果表明本文所提出的方法在适当的隐私损失下可达到所期望的域适应分类准确率。
其他文献
在追求可持续发展的21世纪,海洋资源受到越来越多的关注,甲壳素作为储量仅次于纤维素的海洋生物质资源,具有可再生、可降解、生物相容性高、无毒无污染的优良特性,由于其含有大量的羟基和乙酰胺基等可衍生化的活性基团,可用于构建多种功能材料,在生物医用、包装、分离吸附、光电功能材料等领域具有巨大的潜力。但由于其难溶解难熔融,加工和使用受到极大限制。本论文以甲壳素为原料,利用NaOH/尿素水体系通过冷冻-解冻
人的同名是一种普遍的现象,它引起的人名歧义广泛地存在于世界上不同语言之中,它给区分信息内容中的人名实体所代表的真实对象带来了巨大的挑战。人名消歧任务致力于消除文本中人名指向的歧义,使名字与真实人物形成正确的对应关系。人名聚类方法在对大规模文档的人名消歧上具有适用性,但是特征多位手工选择构造、聚类的结果仍然需要进行分析,在信息爆炸的互联网时代,对于层出不穷新信息进行重新聚类分析的代价较大;面向知识库
背景及目的:临床上,骨骼肌缺血再灌注损伤(SMIRI)是一个常见的病理生理学现象。因其发病机制十分复杂,目前临床上针对该疾病的治疗方案疗效欠佳。迷走神经刺激(VNS)已被证实可在多种器官中发挥有抗缺血再灌注损伤的作用。本研究旨在探索VNS对于SMIRI的治疗作用,并进一步探究VNS发挥抗SMIRI的具体机制。方法:将雄性Sprague-Dawley大鼠随机分为3组,即:对照组、SMIR组与SMIR
语音认证是一种生物识别技术,它利用人的语音特征来进行身份认证。近年来,随着移动技术的进步,语音认证技术被广泛应用于移动设备。然而,现有的语音认证系统极其容易受到欺骗攻击。现有的欺骗攻击方式主要分为重放攻击和模拟攻击。重放的样本可能来自合法用户预先录制的音频,或利用目标用户的音频通过语音合成或转换技术构造生成。模拟攻击指的是音色相近的攻击者模仿目标用户的说话风格以及语音语调来欺骗语音认证系统。一旦攻
使用重打包技术将恶意代码加到流行的良性Android应用中是Android恶意软件最常使用的方式。通过使用如apktool等反编译软件可以将APK文件转换成中间语言Smali文件,在其合适的位置添加恶意代码,更改原始应用的执行逻辑,之后再进行重编译形成新的恶意软件,这就是基于重打包的恶意软件采用的方式。这种恶意软件隐蔽性高,对用户具有欺骗性,但是随着加固、混淆等技术的应用,重打包的技术难度越来越大
基于人工智能技术的行人重识别技术趋于成熟,其通过计算查询图像与行人图像集的相似度,实现对感兴趣人物跨摄像头的精确、高效的定位和追踪,已经被广泛应用于智能监控、城市安防、军事国防等领域。然而,现有工作表明,深度学习模型的安全可用性面临着对抗性攻击的挑战,攻击者通过向模型输入图像中引入精心设计的微小扰动诱导神经网络模型对输入图像错误分类。这类对抗性攻击给人工智能技术所驱动的行人重识别系统带来潜在的隐患
2017年以来,随着窄带蜂窝物联网等新兴技术的出现和落地,物联网进入规模化商用的高速发展阶段。然而,侵入生活方方面面的物联网设备中产生了大量个人隐私数据。而这些数据的泄露将对用户或企业造成难以想象的影响和损失。为了提供物联网数据安全和隐私保护,众多的物联网访问控制协议被提出。但经过深入的安全性分析后发现,大多现有的物联网访问控制协议基于中心化模型构建,依赖一个可信第三方进行访问策略存储和访问行为决
Android软件供应链中包括Android应用的编写、分发、更新等多个环节,其中部分流程和使用工具的防御机制相对薄弱,容易被攻击者作为突破点,达到直接或间接向Android应用中植入恶意代码的目的。近年来,针对Android软件供应链的攻击事件频繁发生,将恶意代码隐藏在Android第三方类库是这些事件中较为常见的攻击方式。Android应用一般会调用多个第三方类库完成某些特定功能,而第三方类库
随着世界经济的全球化,海上航运交通流量逐渐增加。准确可靠的船舶航行轨迹预测,能够有效保障船舶的航行安全,对提高船舶交通管理水平具有重大意义。由于船舶自身的运动特性和外在的环境因素,船舶航迹具有非线性、随机性、趋势性和周期性四个特点,导致船舶航迹预测具有较大的难度。目前的船舶航迹预测仍存在以下问题:一是传统的数学建模困难且预测误差较大;二是轨迹数据量大且维度高,使得特征提取十分困难;三是影响船舶航迹
随着医疗行业与互联网技术的飞速发展和电子医疗数据的急剧增多,不同医疗机构间对于医疗数据共享的需求也越来越迫切。当前医疗数据共享系统大都依赖可信第三方对数据进行处理和管理,且该过程对医患是不透明的,容易导致医疗数据的泄露和滥用。因此,需要构建一套安全高效的医疗数据共享方案并实现数据的访问行为审计。区块链技术具有透明性、不可篡改性和可追溯性等特点,可以应用于电子医疗数据安全共享场景,便于医疗数据的访问