【摘 要】
:
语义分割是计算机视觉领域的重点关注问题,也是场景理解的基石性任务。近年来,深度学习在图像处理、语音识别等领域表现优异,因此语义分割任务也更倾向于采纳深度学习方法,来实现更精准的分割预测。目前,最出色的语义分割方法往往借助全卷积神经网络的结构形式,以此来获取逐像素的分类预测。然而,语义分割是一项密集标注任务,需要在获得目标语义信息的同时对其进行精确定位。而现有的神经网络模型往往会在提取特征的过程中损
【基金项目】
:
陕西省重点研发计划项目(No.2019ZDLGY09-05); 国家自然科学基金(No.61772399);
论文部分内容阅读
语义分割是计算机视觉领域的重点关注问题,也是场景理解的基石性任务。近年来,深度学习在图像处理、语音识别等领域表现优异,因此语义分割任务也更倾向于采纳深度学习方法,来实现更精准的分割预测。目前,最出色的语义分割方法往往借助全卷积神经网络的结构形式,以此来获取逐像素的分类预测。然而,语义分割是一项密集标注任务,需要在获得目标语义信息的同时对其进行精确定位。而现有的神经网络模型往往会在提取特征的过程中损失目标细节,因此语义分割的关键是在捕获高层次的语义信息的同时补充低层次的空间信息。针对这个课题,本文分别从编码器、解码器与辅助信息三个角度出发,提出注意力辅助的多源信息融合语义分割模型。最后,分别使用WHDLD数据集与DLRSD数据集进行实验,证实本文方法的正确性和有效性。1、从精炼编码信息的角度出发,针对语义信息与细节信息难以平衡的问题,设计了一个多阶段特征融合的全卷积语义分割模型。首先,为获取图像最高级的抽象语义信息,采用一个经过预训练的特征提取器的末端输出图作为高阶段语义信息的来源;之后,为保留精细的目标定位信息,借助特征提取器的中间特征图作为低阶段细节信息的来源,并设计一个低阶段特征转换模块实现空间信息的精炼。最后,通过特征融合模块将两种信息源充分融合,并经过上采样操作输出模型的预测结果。新模型通过不同阶段特征的融合过程,对语义信息和细节信息同时编码,实现了不同信息源的综合利用。值得注意的是,新模型中细节信息源的本质为现有特征图的复用,因此不仅实现了对特征的进一步信息挖掘,还减少了创建细节源时的资源耗费。2、从重塑解码信息的角度出发,针对模型上采样结果粗糙的问题,提出一个基于通道注意力机制的上采样优化模型。新模型在多阶段特征融合的基础上,借助注意力机制与跨层连接思想改进了上采样方式,从而极大地改善解码部分。新模型摒弃了常用的直接使用双线性插值法输出预测结果的方式,借助编解码信息共同指导解码器的特征恢复过程,最终大幅地提升了解码器的性能。与其他将编解码信息进行跨层连接的模型不同,新模型借助了通道注意力机制,使解码器可以进行自主优化解码过程,实现了解码信息的重塑。最后,在两个数据集上对新模型进行实验验证与结果分析。3、从辅助信息的角度出发,针对目标边界粗糙的问题,提出了一个利用边界信息源的语义分割模型。现阶段较为先进的语义分割模型都将目标边界信息与其他信息不加区分、共同处理,而新模型通过设计一个边界提取模块,专注于优化目标的边界细节,从而使不同类型的信息得以充分利用。此外,边界约束的引入还实现了目标类别和目标边界的多源信息综合利用。之后,借助Canny边缘检测算法制作了二元边界标签,以便同时利用边界标签与分割标签对模型进行训练,实现模型的多重约束优化。最后,通过对比实验阐释了新方法的有效性。
其他文献
无人机因体积小、成本低、部署灵活等独特优点在信息感知、情报侦察等众多领域内得到广泛应用。作为获取空间数据的重要手段,无人机中蕴含海量的高价值数据,致使它成为被攻击的主要对象之一。这一点可以从过去二十年中公开的无人机安全事件中得到证实,其中最著名的莫过于伊朗截获美军无人机事件。在无人机系统中,无人机数据链路的安全至关重要,它作为无人机机载端与地面控制端通信的纽带,为无人机的运行及各项任务的执行提供了
图像识别相关的深度学习技术在近些年取得了快速的发展。图像识别技术使机器具有了感知环境、识别物体的能力,极大推动了现代工业智能化的发展,可以看到有越来越多的相关应用相继落地。对抗样本通过在原始图像中添加人眼难以察觉的细微的扰动信息,就可以使深度学习模型产生错误的判别结果。对抗样本的存在给深度学习算法和模型造成了威胁,甚至影响了实际中相关深度学习应用的安全。特别是在自动驾驶、人脸识别和金融等对安全性要
近年来,物联网已经从一个新兴概念发展成为了现今社会的热门话题。物联网的应用场景已经不知不觉的渗入了人类社会的各个角落,同时伴随着嵌入式计算机系统、传感器器件、射频识别技术、近场通信、Wi Fi和Zig Bee等技术的进步。其中射频识别被认为是改变生活质量最有潜力的技术之一。电子标签与阅读器在超高频频段进行通信无需物理接触,读写效率高,结构简单,部署方便,能够适应各种应用场景的需求。然而受到硬件功耗
图像融合将来自多个传感器的图像进行组合,最终获取一幅信息更完整的图像。图像融合技术在医学领域主要应用于临床诊断,通过将病变部位的多模态图像进行组合,有利于医生更加准确地进行病变部位定位,提高诊断准确率。本文研究了基于反卷积神经网络自适应变换的CT/MRI医学图像融合算法。论文研究内容如下:提出了基于反卷积神经网络的图像自适应变换方法。为获得待融合图像的最佳变换,利用高斯方向滤波器设计具有不同截止频
唐19-12断块馆陶组具有构造幅度低、砂层薄、横向变化快等特点,本文对地震资料进行了攻关处理,在此数据基础上开展了精细构造解释,通过层控网格层析速度建模,运用变速成图技术,重新落实了唐19-12断块低幅度构造。通过钻井证明,运用该技术落实的构造形态与真实构造形态吻合度高,为唐19-12断块后期的勘探开发工作提供了技术支撑和井位部署依据。
水下无线光通信系统(Underwater Wireless Optical Communication,UWOC)拥有更高的数据速率,更低的时延和更好的安全性等特点,作为一种应用于军事和工业领域的关键技术受到广泛关注。但是UWOC也存在诸多问题,光束在水下信道传播时会受到海水吸收、散射效应以及海洋湍流效应的综合影响而产生严重的衰减。为了提高通信质量以及延长传输距离,可以采用信道编码等技术,同样也可
区块链是一种去中心化的分布式账本平台,作为分布式数据存储、对等网络、共识机制、密码算法等技术的集成,具有去中心化、可溯源、不可篡改等特点。近些年来,应用场景多元化的需求助推了区块链技术的迅速发展,逐步诞生了以比特币、以太坊、超级账本为代表的区块链平台,其系统安全性主要由经典密码学中基于大数分解或是离散对数问题的公钥密码算法和哈希函数提供保障。然而,随着量子计算机的问世,上述主流区块链平台均面临着以
遥感图像的语义分割是遥感图像处理中的一种重要方法,它能为后续的图像识别和场景理解提供必要的基础。遥感图像分辨率大且场景比较复杂、目标尺寸差异大和存在易混淆的物体,这些都会给分割的任务带来更多的挑战。针对上述的这些问题,本文的主要研究内容如下:(1)提出了基于多尺度自适应权重信息流融合算法(MWFNet)用于遥感图像语义分割。为了解决遥感图像的目标多样性和尺寸差异大的问题。提出多尺度编码模块,使用5
在现代战争中,军用飞机扮演着越来越重要的角色。面对严峻的防空环境,作为博弈的一种有效手段,飞机突防技术也趋向于综合化、复杂化和智能化,突防难度越来越高。设计优良的突防航路可以有效缩短航路长度,提高突防成功概率,为作战任务的成功实施提供保障。因此,对突防航路规划技术的研究需求变得越来越迫切。本文针对复杂防空环境下的突防航路规划问题,通过分析不同典型威胁源的特性并建模,生成威胁数字灰度地图。根据飞机进
随着三维点云技术的发展,人们不再满足于二维平面图像,开始向三维领域发展。深度相机可以从场景中获取三维信息,因此被广泛应用于需要更可靠三维信息的人机交互(HCI)和增强现实(AR)。由于深度相机由于其精度的提高并且变得更加便宜和流行,以至于可以部署在智能手机上,研究人员开始积极研究利用深度信息的三维计算机视觉。与深度相机拍摄的深度图像(称为2.5D信息)相比,研究人员试图将深度图像转换为三维点云或通