面向场景分割的判别特征感知方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wangxun416
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景分割作为计算机视觉领域基础且富有挑战的问题,其目的是给场景图像上每个像素赋予一个类别标签。因此,场景分割既需要精确定位中每个像素的位置,又需要准确识别出每个像素所属类别,其丰富的场景解析能力使得它在场景理解、自动驾驶、人机交互、增强现实等领域有着广泛的应用。近年来,得益于深度卷积网络强大的特征表达能力,全卷积网络算法逐渐成为场景分割领域的主流算法。但是,现有算法忽略了不同特征差异,混淆不同特征信息,使得特征判别性下降,导致预测错误。因此,本文以场景分割中的判别特征感知为研究重点,主要从特征解耦和特征选择两个角度增强特征判别性,进而准确高效地建模场景关系、分割场景要素,解决现有算法在特征区分、特征选择、速度精度平衡上的问题,扩展和完善全卷积网络场景分割算法。论文主要研究内容如下:首先,在特征解耦方面,针对场景分割中类内不一致和类间低区分性问题,提出了基于边缘与区域特征解耦的场景分割方案。现有基于全卷积网络算法将场景分割建模为逐像素分类问题,忽略了类别整体关系,导致类内不一致和类间低区分性问题。本文基于边缘与区域特征解耦的思路,提出了判别特征分割算法。该算法利用多尺度上下文关系和通道注意力机制提取区域特征,增强类内一致性;同时,利用显式语义边缘监督约束提取边界特征,增大类间区分性。通过两种特征的交互极大地增强了特征的判别性,提高了算法的分割性能。大量定量与定性实验分析表明,该算法能很好地解决类内不一致和类间低区分性问题,特征判别性和分割性能均达到了当前领先水平。其次,在特征解耦方面,针对实时场景分割精度与速度平衡问题,提出了基于细节与语义特征解耦的场景分割方案。当前实时场景分割方法往往牺牲空间细节信息提升速度,使其在高分辨率特征上判别性下降,进而导致分割精度严重下降。针对这一问题,本文观察到空间细节信息与语义信息对分割性能均很重要,而两种信息对建模编码方式的需求不尽相同。所以本文基于细节与语义特征解耦的思路,提出了双边分割算法和改进双边分割算法。双边分割算法利用深度较浅且通道较多的分支提取细节特征,利用深度较深且通道较浅的分支提取语义特征;同时,通过高效融合两种特征,达到了速度和精度上的有效平衡,有效提高了分割效率。此外,改进双边分割算法在原双边分割算法的基础上简化提炼出了专门适用于实时场景分割的双边分割架构。大量实验结果表明,两种算法取得了当时最佳的速度和精度的平衡,分割效率处于当前领先水平。再次,在特征选择方面,针对场景分割远距离上下文关系建模问题,提出了基于隐式引导特征选择的场景分割方案。远距离关系建模有利于推理分割场景要素,当前场景分割方法往往利用自注意力机制建模远距离关系。但是,自注意力机制中存在大量冗余计算,导致复杂度较高,限制了它的应用;同时,大量冗余信息也降低了特征的判别性。为此,本文基于相似性关系隐式引导特征选择的思路,提出了代表图分割算法。该算法学习特征相似性关系,引导特征选择过程,使其选择有代表性的特征,进而有效建模远距离关系,减少自注意力机制的冗余计算,提高特征判别性表达,大幅提升分割性能与效率。实验结果表明,该算法效率相比自注意力机制方法大幅提升,并且分割性能也处于领先水平。最后,在特征选择方面,针对场景分割类内类间上下文关系建模问题,提出了基于显式引导特征选择的场景分割方案。当前场景分割方法建模上下文关系时,不区分其种类,导致关系混淆、特征判别性下降,进而使得分割结果出现矛盾。针对这一问题,本文基于监督约束显式引导特征选择的思路,提出了上下文先验分割算法和条件分类器分割算法。上下文先验分割该算法利用显式亲和矩阵监督的约束,明确建模场景中同类上下文关系和类间上下文关系,增强了特征判别性。通过综合两种上下文关系,大幅提升了分割性能。条件分类器分割算法利用辅助语义监督引导选择同类特征,动态生成样本特定的分类器内核。该分类器核可以解决类内差异问题,增强了特征判别能力,进而提高算法分割性能。大量定量与定性实验分析验证了上下文先验分割算法与条件分类器算法的鲁棒性与泛化性。两个算法均在多个场景分割数据集取得了领先水平的性能。本文的研究主要针对场景分割在具体应用中的需求,重点研究场景分割中的判别特征感知问题,对推动该技术在场景理解、自动驾驶、人机交互、增强现实等领域的应用具有重要意义。
其他文献
锂离子电池作为兼具高能量密度与高功率密度的能量存储器件,已广泛应用于便携式电子产品、电动交通设施等设备中。然而,商业锂离子电池处于高温环境(>55°C)时,聚烯烃隔膜的热收缩引发的内短路易使电池发生热失控,且传统电极中粘结剂的失效也会使电极材料脱落,导致电池的严重安全事故,无法满足航空航天、石油工业等领域在高温环境的应用需求。为了实现锂离子电池在高温环境下的应用,亟需设计制备安全稳定的锂离子电池隔
学位
近年来,受大脑工作机制启发建立具有人类水平的类脑智能逐渐成为人工智能领域研究的热点,因此借鉴大脑的信息处理方式,建立存算一体的神经网络以实现具有学习、记忆及产生情感等能力的类脑智能是必要的。然而当前有关类脑智能的诸多研究并未基于神经元、突触等基本单元构建存算一体的类脑信息处理架构,导致无法执行分层和并行的信息处理,不能有效解决冯·诺依曼瓶颈,且由于过多地简化了大脑的相关工作机制,使得所实现的功能不
电磁成形是基于脉冲电磁力实现金属工件塑性形变的高速成形技术,具有可提高材料成形极限、抑制工件回弹和起皱等优点,是目前提升铝合金等轻质金属构件性能及制造水平最具潜力的方法之一。然而,电磁成形过程涉及电磁、热、力等多物理场耦合,导致工件变形受到高速、高温和大电流等诸多因素影响,其宏微观变形行为较准静态以及其他高速成形更为复杂,相关的材料力学性能和变形机理尚未被有效揭示,限制了该技术进一步的发展和工业化
储能材料结构中的无序特性对其电化学性能有着重要影响。目前由于缺乏合适的表征手段,对储能材料的无序特性与其电化学性能之间的构效关系研究较少。针对上述问题,在本论文中,我们利用全散射(total scattering)和原子对分布函数(pair distribution function,PDF)分析技术,表征了电极材料中的无序结构,构建了材料的无序结构模型,探究了结构无序与电化学性能之间的构效关系。
情感是一个奇妙而有趣的现象,它与人的日常生活、决策活动和身心健康等诸多方面紧密相关。作为人工智能领域的前沿研究方向之一,情感识别在涉及智能人机交互等相关应用场景中具有重大的潜在应用价值,开展情感识别方法的研究具有重要的理论和现实意义。语音和面部表情是最常见的两种承载情感信息的方式。并且,通过语音和表情识别情感还具备数据获取方便和非侵入性的优势。当前情感识别面临的主要挑战有:(1)情感信息难以有效表
随着Si基CMOS工艺尺寸进入5nm工艺节点,尺寸的进一步缩小面临着短沟道效应、量子遂穿效应、大量悬挂键成为复合中心等问题,迫切需要探索新材料作为FET的沟道层。MoS2是一种禁带宽度合适、厚度可减薄至0.65nm、表面无悬挂键、可免除短沟道效应以及电子在层内运动不存在隧穿效应的优良二维材料,作为Si沟道的替代候选材料之一近年来被广泛研究。但当前MoS2FETs的研究遇到两大难题:实验的电性能(如
锌是人体必需微量营养元素,主要通过消化道吸收。膳食结构不合理或某些疾病状态可导致锌缺乏症。据估计,全球超过20亿人处于缺锌状态。锌参与构成300多种蛋白质,是多种酶的催化因子,并调节DNA损伤修复、蛋白质代谢、信号转导、细胞增殖分化和凋亡等多种重要生物过程,涉及机体抗氧化及免疫系统调控。因此,体内锌稳态失衡可导致包括恶性肿瘤在内的多种不良健康结局。肺癌是我国发病率和死亡率最高的恶性肿瘤,造成了严重
纳米颗粒增强铝基复合材料兼具优良的强度和塑性,在航空航天、汽车、电子、军工等领域具有广泛的应用前景。相比于Ti B2、Al2O3等其他陶瓷颗粒,SiC陶瓷颗粒具有更小的相对密度、更低的热膨胀系数、更高的导热系数和更高的弹性模量等优点,是一种良好的增强相。在众多nano-SiCP/Al基复合材料的制备方法中,液态铸造法因所需设备简单、易于成型且成本较低等优点而备受关注。然而,采用液态外加颗粒及铸造法