【摘 要】
:
图像语义分割旨在实现图像内容的像素级语义理解,其在自动驾驶、辅助医疗、智慧教育等诸多图像处理应用中发挥着核心作用,是视觉理解系统的重要组成部分。近年来,归因于大规模高精度标注数据集的出现和深度模型语义表征能力的不断增强,图像语义分割模型的性能得到显著提升。然而,现有的全监督图像语义分割算法仍存在数据依赖性强、泛化性差等问题,难以被应用到实际场景中。为此,研究人员提出小样本语义分割任务,旨在利用少量
论文部分内容阅读
图像语义分割旨在实现图像内容的像素级语义理解,其在自动驾驶、辅助医疗、智慧教育等诸多图像处理应用中发挥着核心作用,是视觉理解系统的重要组成部分。近年来,归因于大规模高精度标注数据集的出现和深度模型语义表征能力的不断增强,图像语义分割模型的性能得到显著提升。然而,现有的全监督图像语义分割算法仍存在数据依赖性强、泛化性差等问题,难以被应用到实际场景中。为此,研究人员提出小样本语义分割任务,旨在利用少量标注数据(支持图像)完成新类别(查询图像)的分割。相比于现有的全监督语义分割算法,小样本语义分割具有数据依赖性低、模型泛化性强的优势,但也面临新类别标注数据稀缺、分割先验不足的难题。原型学习是解决小样本语义分割的有效手段。其将小样本语义分割任务建模为少量标注下的原型提取与匹配问题,从有限的标注中构建涵盖该类语义的类别原型,通过与原型的最近邻匹配完成分割。尽管原型学习能够有效实现分割先验的提取与传播,其仍存在以下难点:(1)如何克服类内差异性,准确描述类别语义;(2)如何增强类间可区分性,避免语义混淆;(3)如何缓解新类别标注数据稀缺性,解决分割先验不足的问题。针对上述问题,本文展开了如下工作:(1)针对类内差异性带来的类别语义建模难题,提出利用非局部信息缩小类内差异的解决思路,构建基于上下文聚合的小样本语义分割单原型网络。所提方法构建多尺度上下文原型提取器,利用门控注意力机制、多尺度策略和上下文聚合网络,提取具有非局部邻域丰富语义的原型,从而提供准确的分割指导信息。(2)针对类间相似性造成的语义混淆问题,提出利用显著机制提取可判别特征的解决思路,构建基于相似谱交互的小样本语义分割多原型网络。所提算法利用金字塔自适应池化模块,有效捕获全局和局部分割先验,构建相似谱交互模块,实现更具判别力的类别感知特征的提取,进而提升模型的泛化性能。(3)针对标注数据稀缺引发的分割先验不足的问题,提出利用分割质量评价扩充标注数据的解决思路,建立基于数据扩充的小样本语义分割后处理模块。所提方法利用实例可信度推断策略实现分割质量评估,构建高质量、多样化的伪标注集合,利用联合分割优化策略实现高质量元知识的获取。实验结果表明,所提后处理模块带来了显著的性能增益。
其他文献
在企业管理过程中如何发挥人的作用,一直是管理者和研究者关心的问题。随着我国近年来城镇化、信息化的快速发展,以及内外部多变的环境,管理导向也从对员工的行为控制转到如何激发员工自主管理,这为员工敬业度研究提供了基础。作为我国经济体系支柱产业,我国化工行业产值占全球化工产值的40%,居世界第一。但化工在进行生产时普遍具有易燃易爆、有毒有害、以及易腐蚀等特点,同时原材料及废弃物容易造成环境污染问题,潜在的
机械臂是一种复杂的机械控制系统,它能够代替人进行大量重复性的工作,如搬运、喷涂、焊接、装配等。然而,对于工业生产线上所使用的机械臂,只能够按照固定的流程在具体的流水线上执行确定性的任务。为了让机械臂在更复杂的场景中得到应用,需要研究适用于现实环境的机械臂智能控制算法。抓取某个指定的物体而不是抓取任意物体,是在现实场景中实用的需求。本文聚焦于机械臂控制问题中的指定物体抓取问题,深入研究了基于深度学习
当前我国保险行业发展相对稳定,但其经营和管理依然会随着社会结构、生存环境、市场调节等因素的变化而日趋复杂。在此背景下,尤其受社会突发公共危机事件影响,市场的持续性、不定性风险因素增加,保险公司会面临企业管理方面的挑战与考验。2020年初爆发的新冠肺炎疫情正是目前全球范围内最大的突发公共卫生事件,多数保险企业也在这项事件中受到了较为直接的影响。保险企业为实现平稳发展,需要在对市场有较大冲击的公共事件
WB公司是一家经营互联网广告业务的新媒体广告公司,公司成立以来以网络竞价广告投放、数据回收分析、代理运营媒体账户为主要经营业务范围。近几年,随着中国移动互联网的高速发展、智能手机的快速普及,互联网广告行业发生了翻天覆地的变化。特别是互联网广告的载体形式:从第一代的里程碑式产品BBS(Bulletin Board System,网络论坛,与户外广告牌性质相同模式,通过电脑、网络来传播或获得消息);到
近年来,随着所需的神经网络模型越来越复杂,视觉分类任务的多样性也随之增加,不断刷新着其准确性。但对分类精度性能的要求越来越高,使得神经网络结构越来越深,对实现图像分类任务所需的计算能力和内存大小提出了更高的要求。压缩和加速卷积神经网络结构以减少对硬件的依赖性成为研究重点,在网络性能、模型参数量和计算速度之间寻求一个平衡成为研究关键,从而使边缘设备上处理的的数据更加有效。基于此,本文聚焦于基于梯度优
人物属性识别旨在识别给定人物的视觉外观特征,是计算机视觉领域的一项重要研究课题,被广泛应用于人物检索、行人识别、场景理解等多个领域中,具有广泛的应用前景。在人物属性识别任务中由于属性尺度多样、数据集质量欠佳,现有人物属性识别方法对于细粒度属性识别效果不佳。针对上述挑战,本文构建了一个细粒度人物属性数据集,并且提出了三种细粒度人物属性识别算法。本文主要研究内容如下:1.本文构建了适用于细粒度属性识别
随着我国和全球贸易与经济一体化建设进程的推移和加速,加快了促进国际贸易结算业务的蓬勃发展,同时也使得行业竞争加剧。国有商业银行作为先行进入这一市场的“领头军”,具有优越的市场优势。但随着竞争的加剧,也逐渐“力不从心”。如国有商业银行推出的国际结算新产品缺少创新,容易被其他银行“复制”,在银行国际结算市场竞争已经加剧的情况下,没有做到结合自身的特色,发挥自身的优势,结局自然没有达到预期,鉴于此,国有
近年来,军队改革任务基本完成,为了适应军队和国防建设改革调整的需要,顺应时代的发展,立足部队的会计管理现状,需要进一步探索新形势下部队财务管理的模式。随着管理形式的变革和管理要求的提高,武警部队也顺应形势要求,采取会计集中核算形式,在各武警总队成立财务结算中心。军队财务结算中心是管理军队财务活动的组织。而军队财务活动包括军费取得、分配和使用等。军队财务结算中心的高效运行关系到军队财务能否为军队现代
目的 合成盐酸瑞芬太尼原料药的有关物质,为其质量研究提供参照物。方法 以瑞芬太尼的中间体1-苄基-4-(苯基氨基)哌啶-4-羧酸甲酯(6)为原料,经酰化反应、氢化反应及加成反应,合成盐酸瑞芬太尼的有关物质1-(3-甲氧基-3-氧丙基)-4-(N-苯基乙酰胺基)哌啶-4-羧酸甲酯(有关物质B)、1-(3-甲氧基-3-氧丙基)-4-(N-苯基丁酰胺基)哌啶-4-羧酸甲酯(有关物质D);以瑞芬太尼为原料
随着人工智能技术的普及,诸如医疗诊断、社交机器人、疲劳驾驶检测等人机交互系统开始被逐渐应用于现实生活,以此来满足当前社会的各种需求。这些应用大多涉及到生物体识别技术,而人脸的面部表情往往被认为是表达人类情绪的重要方式之一,因此被广泛采用于生物体识别这一领域。让机器准确地识别人脸表情,对人类内在情绪进行感知分析,这对于人机交互系统以及强人工智能方向的发展有着十分重要的意义。然而,人脸表情由于其变化特