【摘 要】
:
显著性目标检测作为计算机视觉领域中的一项重要任务,对于图像高层语义的理解具备重要意义,为各类图像处理和计算机视觉相关任务提供了必要的先验知识。作为像素级图像分割任务,显著性目标检测非常依赖高质量、大规模的像素级标签作为数据支撑,其获取往往费时费力、代价高昂。因此,基于标注高效的图像级标签的弱监督学习近年来受到了广泛关注。现有工作大多关注于如何获取高质量的伪标签,而忽略了伪标签中广泛存在的噪声对于显
论文部分内容阅读
显著性目标检测作为计算机视觉领域中的一项重要任务,对于图像高层语义的理解具备重要意义,为各类图像处理和计算机视觉相关任务提供了必要的先验知识。作为像素级图像分割任务,显著性目标检测非常依赖高质量、大规模的像素级标签作为数据支撑,其获取往往费时费力、代价高昂。因此,基于标注高效的图像级标签的弱监督学习近年来受到了广泛关注。现有工作大多关注于如何获取高质量的伪标签,而忽略了伪标签中广泛存在的噪声对于显著性网络的消极影响,这导致最终的网络模型性能并不理想。为此,本文基于伪标签优化思想,分别从多路信息优化以及伪标签自校准优化出发,从不同的角度探究如何对含噪声的初始伪标签进行有效优化,进而获得高性能的显著性网络模型。综上所述,本文的主要研究工作及创新点如下:(1)构建弱监督显著性目标检测领域中首个显著性目标类别数据集(DUTS-Cls)。该数据集包含44个类别和5959个图像样本,确保所有图像样本的类别标签都能够准确地对应图像中的显著性目标。(2)针对单一伪标签中的显著性信息过于片面的问题,提出了一种基于多路信息优化的弱监督显著性目标检测框架。首先,基于现有的图像处理算法获取风格不同、各有优劣的两种伪标签,作为所提出框架的两路监督源。然后,提出一种新颖的多过滤器指导网络,包括两个指导过滤器和一个显著性解码器。在训练过程中指导过滤器分别学习对应的两路监督源中的显著性信息,在自监督损失的约束下进行整合和细化后,获得纯净的、全面的显著性信息。提纯后的显著性信息以监督的形式被传递给显著性网络,从而完成对显著性信息的提取、整合和传递。大量实验验证了该方法在多个数据集上的表现均优于当前最先进的同类方法,并且具备良好的泛化性和可扩展性。(3)针对伪标签中噪声信息过分干扰显著性网络模型性能的问题,提出了一种简单有效的伪标签自校准优化方法,即自校准学习策略。基于显著性网络在训练初期表现出的对于伪标签中噪声信息的相对鲁棒性,构建显著性网络和伪标签之间相互校准的正循环机制。逐步扩大伪标签中准确的显著性信息,并消除噪声对显著性网络的消极影响。在此过程中一种基于像素间颜色亲密度的传统图像细化算法被用来完成对显著性细节信息的补充。实验验证该方法在多个数据集上的表现均优于最新的同类方法,并且在不增加模型复杂度的条件下可扩展至其他方法中,并提升其模型性能。
其他文献
语音带宽扩展技术旨在应用语音信号处理方法,从窄带语音中恢复出相应的宽带语音信号,它在通信网络、智能终端、语音识别系统等领域具有广泛应用前景。近年来,随着深度学习理论的快速发展,语音带宽扩展技术取得了新突破,语音信号的带宽扩展效果也有较大提升,但相较于原始宽带语音信号,其语音质量仍有明显差距,还难以达到实际应用的要求。因此,语音带宽扩展技术的研究仍具有挑战性。本文应用深度学习理论,对基于深度神经网络
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)是一种多载波传输技术,其频谱利用率高,抗多径能力强,目前己被广泛应用于水声通信。深度学习技术因其在计算机视觉和自然语言处理领域中的出色表现而受到广泛关注,其极强的特征提取能力和拟合能力为水声OFDM通信提供了新的发展空间。本文就水声OFDM系统中的信道编码、调制、信道估计、解调以及信道解码
显著性目标检测是计算机视觉中的一项非常重要的任务,目的在于识别图像中最有辨别力的物体或区域,并从背景中分割出来。近年来,为了节约人力标注成本,弱监督显著性目标检测逐渐蓬勃发展。弱监督方法利用成本低廉的弱标签转化为伪标签参与网络训练,解决了全监督方法标注成本昂贵的问题。然而,由弱标签过渡得到的像素级伪标签相比于真值往往存在大量错误标注的噪声信息,导致现有弱监督显著性目标检测方法难以过滤伪标签中的噪声
<正>审计质量是审计工作的生命线,而审计项目质量更是审计质量的核心,所以抓好审计项目质量是审计工作的关键点。本文从审计项目质量监控概述、监控现状和如何强化审计项目质量监控措施三个方面,对基层央行审计项目质量监控进行分析。
<正>中国人民银行(以下简称人民银行)内审司业务审计处(以下简称业务审计处)以习近平新时代中国特色社会主义思想为指导,深入学习贯彻习近平总书记在中央审计委员会第一次会议上的重要讲话精神,组织、指导、监督和管理人民银行系统业务审计工作,不断提高工作质量,切实履行审计监督、评价和建议职责,在促进人民银行规范、高效履职方面发挥了积极作用。
X射线层析成像(Computed Tomography,CT)能够清晰呈现物体三维结构,因此被广泛应用于医学影像诊断和工业无损探伤等领域。但该技术也存在一定的局限,由于重建三维图像需要采集数以百计的投影,导致重建时间长、辐射剂量大。为解决以上问题,此前的研究从减少投影采集角度入手,提出了基于有限角度、稀疏角度甚至单视角进行CT重建的方法。尽管近年来深度学习的飞速发展加快了单视角CT重建的研究,但目
随社会经济的飞速发展,陆地的许多资源已无法满足人们需要,对海洋资源的开发处于一个十分重要的战略地位。水声通信在海洋资源的环境勘探与开发等方面扮演着不可或缺的角色。相较陆地无线通信系统,水声通信面临更多挑战,如时延扩展长、带宽受限、多普勒效应显著以及快速时变等。为实现在复杂多变水声信道中的可靠通信,本文将正交时频空间调制(OTFS)与水声通信结合。针对OTFS水声通信系统中的信道估计与信道均衡技术展
无线感知是一种通过分析受目标状态影响的无线信号来获取感兴趣目标状态信息的新兴非接触感知技术。该技术利用周围广泛存在的无线信号来对目标状态进行感知,其具有低成本、不受光照影响、隐私性较好等优点,因而使得其在智能家居、智能监护、人机交互领域有着广泛的应用前景。受深度网络在计算机视觉领域广泛应用并取得丰富成果的启发,无线感知技术近年来很多工作都倾向于采集无线数据集,然后基于数据构建无线射频图像数据集,接
遥感图像目标识别是一种图像级的任务,目的是分辨遥感图像中物体的类别,在军事安全、海上交通等方面应用广泛。近年来,深度卷积网络在遥感图像识别任务中表现优异,相对于传统方法展现出巨大优势。目前,深度学习在遥感图像目标识别领域主要的研究方式为利用注意力机制获取辨识性特征或是加入检测、分割等子网络定位识别重点区域。然而,多数遥感图像目标识别研究仅适用于高分辨率遥感图像。针对低分辨率遥感图像目标识别准确度较
随着资源需求的日益增加,世界各国愈发重视海洋资源的勘探与利用。水下无线传感器网络(Underwater Wireless Sensor Network,UWSN)作为开发利用海洋的重要技术手段之一,受到了学界和业界的广泛关注。但是,目前对水下无线传感器网络的研究仍面临诸多挑战,例如,水下传感器网络多功能节点的设计、网络节点的部署算法等。本论文围绕水下无线传感器网络的移动节点部署方法和水下多媒体信息