面向计算机视觉任务的深度卷积神经网络鲁棒性研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:yaki84
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习技术快速发展,已经成为人工智能领域的研究热点和主流发展方向。尽管某些基于深度学习的视觉应用已经开始向产品化方向发展并取得一定成绩,但深度学习技术全面、深入地向产业界进行转化仍存在诸多限制,其中,深度模型鲁棒性是关键因素之一。深度模型鲁棒性要求模型在常规训练集上具有显著的性能、在噪声数据集上具有良好的稳定性同时在分布发生偏移的测试数据上具有较好的泛化性能。为了全面提高模型在不同视觉测试场景下的鲁棒性,本文首先对模型鲁棒性问题进行建模分析,并将建模结果作为本文评价模型鲁棒性的统一依据。然后本文以计算机视觉任务为主要应用场景,结合深度模型鲁棒性的限制因素,对深度模型进行模块化分析。根据分析结果,本文以增强模型的特征提取和鉴别能力为核心切入点,从增强卷积神经网络的特征提取能力、模型的特征鉴别能力和特征在模型中的一致性响应三个方面进行深入研究,论文的主要创新性工作包括:(1)提出了基于在线推理策略的自适应空洞卷积神经网络,实现模型在训练过程中自适应地调整卷积核的感受野,增强卷积神经网络的特征提取能力。空洞卷积通过引入空洞值这一参数使相同尺寸的卷积核获得了更大的感受野,而错误的空洞值选择会降低空洞卷积的效率,给模型训练造成影响。针对这一问题,本文提出了空洞值在线推理策略,并通过引入Gumbel-Softmax函数来近似拟合空洞值采样过程。同时设计了马尔科夫聚合模式等多种层间信息聚合模式对隐藏单元的信息更新方式进行建模。实验结果表明,本文提出的自适应空洞卷积神经网络可以灵活嵌入卷积模型进行训练,并对模型在典型视觉任务上的鲁棒性带来稳定的提升。(2)提出了基于主动学习的Active Dropblock方法,实现Dropblock中掩码的在线优化,增强模型对数据中所包含有效特征的鉴别能力。Dropblock通过使用结构化掩码对特征进行扰动,克服了传统Dropout在卷积神经网络效率低中的问题,然而掩码的生成缺乏合理的指导,给模型训练效率造成一定负担。针对这一问题,本文首先基于主动学习思想对模型的更新过程进行优化,然后通过构建参数选择器实现掩码的在线优化。实验结果表明,本文提出的Active Dropblock可以有效提高模型对对抗样本的抵抗能力,同时,该方法提升了模型对数据的利用效率以及特征在模型中的激活响应。(3)提出了基于对比学习的鲁棒性学习模式,提升模型在未知测试数据上的泛化能力,增强特征在模型中的一致性响应。数据增强技术通过将增强后的图像数据添加到训练集,扩大了训练集的数据分布程度,一定程度上提高了模型在未知测试数据上的泛化能力,然而有限的数据增强操作无法应对复杂的现实测试环境。针对这一问题,本文首先通过引入不同的数据增强方法构建干净样本的增强变体,并使用这些图像样本构建基于类别敏感的正负样本对,然后将这些样本同时输入模型进行训练,在特征提取和样本预测阶段,本文分别提出了基于对比学习的特征一致性和预测分布一致性约束策略,对特征及预测分布的一致性表达进行约束。实验结果表明,该方法可以有效增强模型同类样本的特征在模型中的一致性响应以及数据的利用效率。
其他文献
超分辨率作为图像处理领域内的关键技术,因其能够提高图像视频的分辨率,丰富纹理细节,在诸多领域都有重要的理论意义和应用价值,一直以来受到了学术界和产业界的广泛关注。近年来,随着深度学习理论和各种卷积神经网络的快速发展,基于深度学习的图像视频超分辨率重建方法成为了研究热点。然而,在实际应用中,图像和视频超分辨率技术经常面临着各复杂场景的挑战,如计算资源有限、退化方式多样(降采样、噪声、伪影、光线明暗和
学位
青少年道德教育是思想政治教育的重要部分,也是提高思想政治教育实效性的关键要素。提高青少年道德教育的实效性,不仅关系到青少年的茁壮成长,关系到立德树人的根本目标与社会主义道德建设的长远发展,也是建设社会主义现代化、实现中华民族伟大复兴的客观要求。中日青少年的道德教育属于综合性的探索,它在哲学、教育学、伦理学、社会学等学科的基础上,将青少年的道德学习理论与道德养成实践结合起来,探索道德境域的改变以及完
学位
随着我国铁路运营里程尤其是高速铁路运营里程的逐年增长,保障高铁安全运营的铁路巡检工作日益繁重。考虑轨道巡检工人的人身安全并减轻他们的工作强度,我国研发出具有轨道巡检功能的高速综合检测列车(High Speed Comprehensive Inspection Train,HSCIT)。HSCIT配备了大量的相机传感设备采集轨道的图像信息,目的是利用采集到的图像实现轨道故障的自动检测。由于HSCIT
学位
状态评估与剩余使用寿命预测算法研究为动车组轴承运行和维护管理提供强有力支撑。随着传感技术迅猛飞速发展,基于数据驱动的深度学习方法在故障诊断和健康管理研究领域逐渐成为较为有效的研究方法。然而,在数据匮乏的情景中,基于有监督的深度学习方法性能通常会骤降,甚至会失效,例如在运行工况复杂、振动监测数据为非全寿程数据等情景。迁移学习方法通过半监督或非监督建模,构建源域数据到目标域数据之间的映射关系,从而在目
学位
图像修复指的是利用受损图像中的已知信息,恢复缺失区域的内容。近几年,随着深度学习技术的发展,图像修复无论在视觉效果上,还是修复结果的准确性上,都取得了突破性的进展,并且在文物保护、老照片修复、影视特效制作以及图像目标移除等领域得到了广泛应用。因此,本文针对受损图像中的大面积缺失区域和不规则缺失区域展开研究,通过对图像结构和细节等方面的分析增强特征的表征能力,提高修复结果的准确性和视觉质量。论文主要
学位
像素级图像语义理解作为一种细粒度的语义理解任务,不仅能够判别出图像中目标的语义信息,还能够准确地对其进行定位并描绘出其边缘,是计算机视觉领域中的基础任务之一,在自动驾驶、智能交通、智慧医疗、工业检测等领域展现出了巨大的应用前景。目前,针对复杂的自然图像场景,提供区域以及边缘精确信息的像素级语义理解仍面临着巨大的挑战。针对大规模像素级语义标签难以获取、边缘级像素语义理解结果不够精准和清晰、以及缺乏面
学位
为满足居民在市域及都市圈便捷出行并发展多层次的轨道交通,近年来各大城市开始规划建设市域快速轨道交通系统(简称市域快轨)。既有城市轨道交通普遍采用的站站停运营组织模式,旅行速度低、出行耗时长、服务同质化,不能满足居民差异化的出行需求,所以根据长短途客流特征开行快慢车逐步成为市域快轨运营组织的发展趋势。快慢车运营模式下线路通过能力、越行站位置选择及布局、运行方案编制等均呈现新的特点,不能沿用既有城轨系
学位
迈入“十四五”,数字新基建加快建设,5G融合应用走向纵深,通信行业赋予经济社会数字化转型升级的能力全面提升。然而,新兴技术的发展同时伴随着海量数据的爆发,作为重要的国家基础服务设施,光纤通信系统的升级扩容迫在眉睫。虽然时分复用、波分复用、偏振复用和相干调制等手段的引入助力光纤传输链路的容量实现了质的飞跃,但受非线性等效应的制约,单模光纤传输容量的剩余可扩展范围相对有限。空分复用光纤可通过模式复用或
学位
随着高速铁路建设的不断推进,我国已经初步建成以重点城市为枢纽,覆盖主要社会经济发展区域的“八纵八横”高速铁路网。高速铁路枢纽作为路网的关键节点,由于新建线路的引入,其形态逐渐由单站枢纽转变为具有多个独立客运站的多站枢纽。多站枢纽具有多个独立作业的车站,因此如何合理利用枢纽内的场站资源成为提高枢纽整体运输能力的关键。本文从资源统筹利用的角度出发,根据枢纽内的线路分布情况及车站各项设施设备的布置情况,
学位
在高速铁路的长期服役过程中,无砟轨道下部路基结构受地下水位变化、土质不均、近场施工扰动等因素的影响,不可避免地会产生不均匀沉降。路基出现不均匀沉降后会导致轨道结构几何形位发生变化,形成线路不平顺,增大轮轨动力相互作用,并在无砟轨道结构中产生附加应力,易引起轨道结构出现损伤病害,影响轨道结构的服役状态和使用寿命。然而目前路基不均匀沉降研究在考虑轨道结构塑性损伤本构及界面黏结方面存在不足,无法准确揭示
学位