基于噪声鲁棒性的弱监督显著性目标检测研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:dingjk3883085
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显著性目标检测是计算机视觉中的一项非常重要的任务,目的在于识别图像中最有辨别力的物体或区域,并从背景中分割出来。近年来,为了节约人力标注成本,弱监督显著性目标检测逐渐蓬勃发展。弱监督方法利用成本低廉的弱标签转化为伪标签参与网络训练,解决了全监督方法标注成本昂贵的问题。然而,由弱标签过渡得到的像素级伪标签相比于真值往往存在大量错误标注的噪声信息,导致现有弱监督显著性目标检测方法难以过滤伪标签中的噪声信息。本文从解决伪标签中噪声信息干扰的角度出发,提出了一种噪声鲁棒生成对抗网络和一个上下文特征增强网络。前者赋予显著性网络噪声鲁棒性,后者提升显著性网络对于困难场景的检测能力。本论文的主要创新点具体如下:(1)针对现有方法受到伪标签中噪声信息带来的错误指导,导致检测结果中包含大量非显著性噪声的问题,本文提出了基于对抗学习的噪声鲁棒显著性目标检测方法。该方法主要包括两个部分:噪声鲁棒生成对抗网络和噪声适应性训练策略。噪声鲁棒生成对抗网络可以从高阶数据分布上将显著性信息与噪声信息分离,使网络对于伪标签中的噪声信息具有鲁棒性;噪声适应性训练策略则在训练过程中将每一批次的伪标签按噪声数量分为优劣样本,并针对优劣样本分别赋予不同的训练权重以及适应性的噪声分离策略,使网络可以在学习显著性信息与学习对噪声的鲁棒性上保持最优的优化途径。实验验证了本方法的有效性,相比于其他方法,本方法不仅可以学习到显著性数据集中的高阶结构性信息,还能对伪标签中的噪声信息有足够的鲁棒性。(2)针对现有方法难以准确检测困难场景检测并因此减弱网络的噪声鲁棒性的问题,本文提出一种对伪装目标数据分级增强方法,同时设计了一种多尺度上下文特征增强解码网络提升对困难场景的信息提取能力。伪装物体数据增强方法对伪装物体数据集按伪装等级进行划分,筛选出其中最能帮助显著性困难场景训练的场景,利用这部分数据补齐原有显著性训练集中的困难场景,网络对于困难场景的语义理解更加深刻。多尺度上下文特征增强解码网络则利用多种不同大小的卷积帮助网络对每一层特征进行全方位的提取和融合,使网络应对困难场景依旧有足够的信息提取融合能力。实验证明,本方法不仅使网络对困难场景依旧保持高度的噪声鲁棒性,且针对性增强了网络对于困难场景的显著性检测效果。
其他文献
计算机断层成像技术(CT)是一种已经广泛运用于临床辅助诊断和医学观察的成像方法。随着人工智能时代的到来,基于深度学习的单视角CT重建技术成为了当前学术界的热点研究方向之一,相比于传统CT重建算法,单视角CT重建技术有着辐射剂量小,重建速度快等诸多优点,在医疗领域中,可应用于对癌症患者靶区进行实时定位等任务。本文对当前的主流单视角CT重建网络进行分析,并解决其中存在的问题,研究内容主要分为三部分:(
学位
随着海量的各式智能设备接入网络,以及各种新型产业海量数据传输与共享,人们对于无线通信的流量需求正以指数级增长。为了解决稀缺的频谱资源与快速增长的流量需求之间的矛盾,第五代(5-th Generation,5G)通信网络乃至正在规划的第六代(6-th Generation,6G)通信网络都在研究使用更高的频率进行通信,其中毫米波(Millimeter Wave,mm Wave)因其丰富的频带宽度而受
学位
随着通信技术的飞速发展,触觉作为视听之外人类第三大感知模态,赋予了人类感知与改变客观世界的能力。高质量触觉通信技术受到了学界和工业界广泛的关注。触觉遥操作系统是触觉通信的重要用例。触觉遥操作系统是一个通信延迟敏感的人类在环的闭环系统。目前有多种控制结构用于遥操作系统的稳定性控制,而通信延迟下不同控制下的遥操作系统的性能和稳定性,仍然是一个待研究的问题。遥操作系统性能的追求目标是临场感,指没有物理出
学位
移动通信技术的发展日新月异,促使各类通信设备不断地迭代升级。手机作为当今社会中最为常用的移动通信设备,在近些年的研究中受到了广泛的关注。虽然手机等移动设备的天线技术在不断进步,但由于进入5G时代,由于毫米波的特性,5G手机的天线在传输信号时容易受到路径损耗的影响,这使得天线仍需要进行改进。此外,应用于手机上的微带天线的工作带宽较小,较难同时满足兼容不同国家5G工作频段的需求。因此本文针对上述现状,
学位
红外弱小目标检测与跟踪是计算机视觉领域的研究热点。由于红外图像中弱小目标空间尺度小、强度弱,因而其形状、颜色、纹理特征不明显,且极易受复杂背景和噪声的干扰,导致提升目标检测算法性能的难度大大增加。随着红外弱小目标检测技术研究的不断探索,各类检测算法应运而生。针对这一难题,本文分别研究了基于改进动态规划检测前跟踪(Dynamic Programming Track Before Detect,DP-
学位
癌症严重威胁人类健康,患者的预后评估有助于诊疗方案的确定,有着重要的临床意义。在预后评估中,生存预测是其中的重要变量,分子分型的预测也有助于判断新辅助治疗的疗效,但预后评估本身是一个相对困难的任务。随着人工智能技术发展,基于深度学习的预后评估取得了很大进展,且越来越得到医学专家认可。然而目前的基于深度学习的预后生存预测方法未充分利用医生先验,对多模态信息也使用较少,生存期预测的准确率还有待提高;基
学位
随着无线通信技术的发展以及各种通信接入设备的增多,当前固定的频谱分配政策极大的限制了对有限频谱资源的利用。认知无线电技术允许认知用户机会式地利用环境中的空闲频谱资源,有利于提高频谱利用率,因而受到了广泛的关注与研究。同时,以学习并获取最佳动作选择策略为目标的强化学习算法能够极大提高系统的智能性,在自动控制和资源优化等领域受到了广泛应用。本文研究了基于强化学习的认知无线电动态频谱接入算法,实现了对有
学位
在多媒体信息化的浪潮中,人们可以利用现代化的拍摄设备和智能化的图像处理软件随心所欲地记录生活,但同时也给不法分子进行图像恶意篡改和信息犯罪提供了空间,数字图像取证技术应运而生。作为数字图像被动取证技术中的重要分支,相机型号来源鉴别为维护司法正义、树立版权意识及打击网络犯罪等方面立下汗马功劳,其目的是将待检测图像与其拍摄的相机模型建立联系以推动相关案件的司法取证工作。在传统的数字图像取证中,相机来源
学位
语音带宽扩展技术旨在应用语音信号处理方法,从窄带语音中恢复出相应的宽带语音信号,它在通信网络、智能终端、语音识别系统等领域具有广泛应用前景。近年来,随着深度学习理论的快速发展,语音带宽扩展技术取得了新突破,语音信号的带宽扩展效果也有较大提升,但相较于原始宽带语音信号,其语音质量仍有明显差距,还难以达到实际应用的要求。因此,语音带宽扩展技术的研究仍具有挑战性。本文应用深度学习理论,对基于深度神经网络
学位
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)是一种多载波传输技术,其频谱利用率高,抗多径能力强,目前己被广泛应用于水声通信。深度学习技术因其在计算机视觉和自然语言处理领域中的出色表现而受到广泛关注,其极强的特征提取能力和拟合能力为水声OFDM通信提供了新的发展空间。本文就水声OFDM系统中的信道编码、调制、信道估计、解调以及信道解码
学位