【摘 要】
:
语义分割任务一直是国内外众多学者的研究热点,在自动驾驶、智慧安防和新零售等领域具有广阔的应用前景。目前,随着深度学习的广泛应用,基于深度学习的全监督语义分割实现了语义分割性能上的巨大突破,然而这种性能的提升依赖于对大量的训练图像进行逐像素的人工标注,这种昂贵的标注方式无法实现对社交网络中海量图像数据的充分利用。因此,近年来人们逐渐将关注点投入到弱监督语义分割任务中,基于弱监督的语义分割方法仅需要图
【基金项目】
:
国家自然科学基金(No.61772400); 陕西省重点产业链项目(No.2019ZDLGY03-08);
论文部分内容阅读
语义分割任务一直是国内外众多学者的研究热点,在自动驾驶、智慧安防和新零售等领域具有广阔的应用前景。目前,随着深度学习的广泛应用,基于深度学习的全监督语义分割实现了语义分割性能上的巨大突破,然而这种性能的提升依赖于对大量的训练图像进行逐像素的人工标注,这种昂贵的标注方式无法实现对社交网络中海量图像数据的充分利用。因此,近年来人们逐渐将关注点投入到弱监督语义分割任务中,基于弱监督的语义分割方法仅需要图像的弱监督标注即可实现语义分割任务,从而摆脱了对大量像素级标注的依赖,大幅提高了语义分割任务的实用性和灵活度。目前,基于弱监督的语义分割方法中使用的弱监督标注方式主要可分为以下几种:边界框、线条和图像级标签。相比于其他两种标注方式,图像级标签所需成本最低,且大量带有精确图像级标注的数据可以在社交网络中被快速的获取。所以,基于图像级标签的语义分割方法也受到了更多的关注。因此,本文围绕以图像级标签作为弱监督标注的弱监督语义分割任务展开了深入的研究。由于图像级标签包含的监督信息最少,为了进一步挖掘可用的监督信息,本文将亲和力感知引入到基于弱监督的语义分割方法中并利用噪声学习对弱监督语义分割任务进行了改进。本文的主要工作如下:(1)提出了一种基于自适应亲和力和类别重分配的弱监督语义分割方法。该方法首先提出了自适应亲和力机制,通过计算特征空间中像素点间的相关关系,实现了像素点间的信息传递,充分利用了可用的监督信息。其次,该方法提出了类别重分配机制,通过计算特征空间中像素点与每个类别中心点的距离,实现像素点类别的重分配,缓解了网络训练后期对于错误标签的过拟合,提高了网络的抗干扰能力。(2)提出了一种基于噪声学习的弱监督语义分割方法。该方法首先提出了一种双视图网络,旨在利用其中一个网络分支产生的预测信息为对应分支提供额外的监督信息。在此基础上,该方法提出了互审查机制和互学习机制,其中,互审查机制通过计算其中一个网络分支各像素点的预测结果与对应伪标签之间的相关关系,从而过滤掉对应分支中的噪声标签。而互学习机制通过挑选其中一个网络分支的可靠预测为对应分支提供额外的可靠标签,从而进一步提升了网络的鲁棒性。(3)提出了一种基于空间依赖性建模和亲和力改善的弱监督语义分割方法,旨在利用Transformer对长距离的语义信息进行建模。该方法首先引入空间依赖性建模机制,将图像级标签与类激活图耦合,避免了图像空间拓扑信息的破坏。其次,该方法引入了亲和力改善机制,利用长距离亲和力注意力图进一步改善了分割结果。
其他文献
在高中化学教学中开展爱国主义教育,可以从现行化学教材、化学高考题中深度挖掘爱国主义教育的资源,再利用信息技术、任务群、人物传记等多种方式把科学文化知识学习和爱国主义教育融于一体,实现立德树人之教育使命。
随着互联网和智能手机的普及,信息传播媒介逐渐从以文本为主过渡到以图像视频为主。目前,互联网上每天会产生海量的视频数据,亟需设计高效的智能算法对视频进行自动分析。视频描述技术是一种理解并分析视频内容的方法,旨在将视频转换为一段描述视频内容的文本。目前,基于深度学习的视频描述算法已取得不错的结果,但是在提取视频语义信息方面还存在诸多问题,如利用动态特征中的时序信息、加强关键目标的作用、发挥多层级视觉特
随着遥感技术的飞速发展,目前可获得的遥感数据越来越丰富,针对遥感数据的场景理解也越发引起关注。语义分割任务作为遥感数据场景理解中的重要任务,有着极其广泛的应用。虽然基于深度学习的方法已在遥感图像分割领域取得了优异的效果,但还存在资源消耗大、边缘分割困难、上下文处理方法仍需优化等问题。针对这些问题,本文结合多任务学习、注意力机制及类别上下文增强思想对遥感图像语义分割展开研究。本文主要研究内容如下:1
在中国,肝癌的发病率和死亡率常年居于高位。目前肝癌患者在治疗过程中通常通过多时相CT扫描来确定自身肝肿瘤的情况。利用计算机实现CT图像中肝肿瘤的自动分割不仅节省了手动标注需要的人力物力,还降低了人为标注过程中因主观因素造成的误标漏标风险。多时相CT扫描包括按时间顺序获得的动脉期图像、门静脉期图像和延迟期图像三期图像。其中动脉期和门静脉期图像的成像时间相近,图像中各器官组织结构相似,延迟期图像中各器
随着计算机运算能力的提升和深度学习技术的迅速发展,基于深度学习的行人重识别方法相较于传统行人重识别方法在识别精度上有了很大的提升。然而,基于深度学习的行人重识别方法通常采用深度卷积网络作为行人特征提取骨干网络,利用高维特征表示行人,这引入了大量的参数量和计算量。本文主要研究内容是设计轻量的行人特征提取骨干网络、轻量的行人特征对齐模块和高效的散列层,可以快速且准确地进行行人重识别。具体工作内容如下:
随着无线通信技术的飞速发展,微波滤波器作为无线通信系统中不可或缺的重要器件,其生产需求日益增加,其物理结构趋于复杂化和多样化以满足日益严苛的性能要求。从微波滤波器指标确定到成功完成生产是一个相当复杂的过程,其中调试是所有生产环节中所占时间比重最大的环节,调试成本在滤波器生产成本中占有重要地位。随着生产规模的逐渐扩大和微波滤波器结构的不断创新,单纯依靠经验的人工调试带来的时间成本和人力成本都逐渐变得
高光谱图像(Hyperspectral Image,HSI)分类是遥感对地观测领域的一个重要的分支,其应用范围较为广泛,因而极具研究价值。由于实际标签样本获取较为困难,一般的基于深度学习的HSI分类算法的性能欠佳,因此小样本问题是HSI分类领域急需解决的难题。高光谱像元包含丰富光谱信息,并且临近像元之间具有很强相关性,因此充分利用像元的光谱信息和周围邻域的空间信息对提高分类性能至关重要。同时,虽然
电子信息产业的迅速崛起促进了基于光电探测器件的光电传感器发展。环境光传感器和接近传感器芯片被广泛应用于消费电子、工业、医疗等设备,提供了诸多智能化控制。然而,随着芯片应用场景的扩大,将环境光传感器和接近传感器集成到一个芯片中以实现芯片面积最小化和功耗最低化的方式成为了环境光传感器和接近传感器的研究热潮。本论文对环境光传感器动态范围、暗电流抑制、红外接近传感器中背景光抑制等关键技术进行研究,基于3.
随着计算机技术和深度学习的飞速发展,视频目标检测技术得到了很大提升。在实际工业应用中我们对模型的轻量化和实用性提出了更高的要求。目前基于深度学习的视频目标检测方法主要使用静态推理方法,不仅降低了模型的表达能力,而且不能满足不同设备对多样性算力的需求。本文主要研究内容是设计基于动态神经网络的视频目标检测网络、高效的动态推断方法和特征融合等,可以实现低能耗的视频目标检测。具体工作如下:(1)提出了基于