基于对抗性样本检测与还原的安全图像分类器的研究与实现

来源 :广东技术师范大学 | 被引量 : 1次 | 上传用户:d42953533
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络等机器学习模型在一系列的分类任务中表现突出,其应用也日益广泛。但是有研究表明,神经网络等模型的安全性是很脆弱的,其分类结果易受对抗性样本的影响,即会以很高的概率出现错误分类的情况,产生逃逸攻击并进一步对安全造成威胁。根据分类器模型和数据集的特性,有许多生成对抗性样本的方法,为了防御尽可能多种类型的对抗性样本,本文在前人的基础上提出了针对不同类型的对抗性样本的防御框架,以构建安全的图像分类器。本文分析了国内外的相关研究成果,研究了神经网络框架,探讨了对抗性样本攻击与防御方法。常见的MagNet和FeatureSqueezing等方法,是在样本进入到分类器之前增加自编码器作为过滤装置,并利用不同类型的样本在经过自编码器(AutoEncoder,AE)和分类器之后所产生的差异性以检测对抗性样本,但是检测出来的对抗性样本并不做进一步的处理。为了克服它的不足,本文提出了一种框架,利用对抗性样本和正常样本在经过变分自编码器(Variational AutoEncoder,VAE)的隐藏层时所产生的散度的差异作为检测的指标,并进一步改变对抗性样本的散度,从而重构出正常的样本,以提高分类器的准确率。框架由变分自编码器和卷积神经网络(Convolutional Neural Network,CNN)两种神经网络模型组成,VAE作为检测器和还原器被放在CNN之前,CNN作为分类器用于样本的分类。检测的方法是基于正常样本和对抗性样本散度的区别,利用VAE来检测对抗性样本;而还原的方法是通过VAE改变对抗性样本的散度以去除对抗性扰动,并将其重构为正常样本。该框架不仅能用于对抗性样本的检测,并能够进一步将对抗性样本还原成正常样本,提高了分类器的准确率,防止了逃逸攻击。实验结果表明,训练后的VAE能够帮助CNN正确分类,最优的ROC-AUC能达到0.94,表明该框架能够区分对抗性样本和正常样本,并能够将对抗性样本还原为正常样本,使得对抗性样本经过还原操作后再输入到分类器的分类准确率有了2%-10%的提高,实现了一个安全的图像分类器。
其他文献
急性肺栓塞(APTE)是一种潜在的致死性疾病,其发病急、进展快、病死率高达30%。胸痛、呼吸困难、咯血三联征是APE的典型表现,但以典型三联征表现的APTE在临床上比较少见,容易漏
随着目前互联网技术的进步速度正在不断的提升,我们国家在更多的领域和层面上都受到其影响而发生了变化,不光是社会经济的层面与互联网之间进行了融合、互相借用以及整体的转
对一种新型的基于直线电机驱动的偏心夹紧装置系统的工作原理进行了分析,给出了工作原理图,并给出了相应的力学计算公式。该装置提供了一种解决偏心轮的旋转运动与直线电机往复
随着科技水平的不断提高,电网的应用和范围也随之不断扩大。随之而来的不仅仅是用电范围的扩大,同样也伴随着低频振荡等现象陆续的密集出现。而电网系统中出现的低频振荡等现象
后循环是由椎动脉、基底动脉和大脑后动脉组成,该系统主要供应脑干、小脑、丘脑、枕叶和海马及部分颞叶和脊髓的血液。后循环梗死临床表现复杂多样且大多病情凶险,近年来,我们在
随着集成电路的设计规模不断增大,功能验证逐渐成为整个设计过程中的瓶颈.文章在对传统的验证方法进行分析的基础上,介绍了使用总线功能模型的验证方法,并对总线功能模型设计
以丙烯酰胺和疏水单体为原料,过硫酸钾-硫酸亚铁为引发剂,采用溶液聚合法合成了疏水型高强度水凝胶.研究了单体组成、单体浓度、引发剂用量、交联剂用量、反应温度等因素对产
黄土高原水蚀风蚀交错区在强烈的水蚀风蚀作用下,土壤养分流失严重,土壤退化明显。但不同的土地利用方式,这种退化规律有较大的差异。以位于黄土高原水蚀风蚀交错区的六道沟
介绍一种无杆活塞气缸与二级杠杆-偏心轮复合的浮动式传动系统的工作原理、结构特点和力学计算。几种简单的增力机构和无杆活塞气缸进行合理的组合后,不仅可以实现力的多级放
受城市化进度加快以及气候变化的影响,合肥市降雨特性在发生一系列的变化,根据1954-2013年合肥市气象观测站基础降雨资料,运用Mann-Kendall趋势分析法和Mann-Kendall突变检验