基于卷积神经网络的图像语义分割算法研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:GWstars
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是一项关键视觉技术,其目的是为图像中所有像素分配对应的语义标签。经过多年发展,图像语义分割已取得了不少成果,但由于分割任务的复杂性、以及深度学习的局限性等原因,仍有许多问题待解决。例如,无法很好保存边缘细节特征;在提取语义上下文和充分利用特征信息方面效果不佳,导致特征表达能力不足;网络参数量过大。因此,针对以上问题,本文对基于卷积神经网络的图像语义分割进行深入研究,并从解决皮肤镜图像病灶提取、遥感图像道路提取和路面图像裂缝分割三种典型应用问题的层面改进算法。本文主要研究工作及贡献如下:(1)针对皮肤镜图像中病灶边界模糊以及毛发干扰多的问题,提出一种结合通道与空间注意力的病灶分割算法。首先,设计了一个通道权重更新模块,通过通道加权对网络提取到的特征进行筛选,突出病变特征;其次,设计了一个密集空间注意力模块,该模块先通过级联扩张卷积在扩大感受野同时保留了更具细粒度的特征,再以分层残差连接实现多尺度空间信息密集聚合,然后通过全局和局部注意力引导网络加强关注目标区域,减少背景干扰;最后,构造了一种加权边界损失函数,通过对病灶轮廓的强监督,减少病灶边缘特征的丢失。实验结果表明,该方法在ISIC 2018和PH2数据集上Dice系数分别达到了91.3%、92.2%,各指标均优于目前主流方法。(2)针对高分辨率遥感图像中道路形态多样且被遮挡严重的问题,提出了一种基于扩大感受野和边缘增强的道路分割算法。首先,设计了一种由残差扩张块构建的编码器,可以在不增加参数量的情况下访问更大范围的像素空间;其次,设计了一个多级特征深度聚合模块,在网络中心进一步扩大感受野,捕获多尺度全局上下文特征,并将其融合以实现更强的特征表示,以便网络更好地处理目标尺度变化;最后,在上采样部分设计了一个分层融合边缘增强模块,通过大核卷积弥合不同层次特征之间的差异,强化边缘信息。实验结果表明,该方法在Deep Globe数据集上F1-score达到80.4%,相比现有算法提高了1.3%,有效提升了道路分割精度。(3)针对路面图像中裂缝拓扑结构复杂的问题,提出一种基于特征融合和金字塔注意力的裂缝分割算法。首先,在特征提取阶段设计了一个交叉特征融合模块,通过特征图的重用增强了相邻层次的特征融合和信息交换;其次,在解码器之前设计了一个特征金字塔注意力模块,采用多组具有不同扩张率的并行扩张卷积,提取多尺度对比信息来区分裂缝和背景,显著提高了网络对目标尺度变化的鲁棒性;最后,设计了一个语义增强模块,在高低层特征融合时提升特征图之间的语义一致性,抑制低层特征图中的无用信息。实验结果表明,该方法在CRACK500和CFD数据集上F1-score分别达到了72.3%、71.9%,优于主流算法,可用于复杂路面的裂缝检测。
其他文献
基于传统奈奎斯特采样定理的信号处理方法在获取高分辨率雷达图像时会产生大量数据,给硬件设备带来很大的压力。近年来,提出了一种新的、基于稀疏表示的信号处理方式——压缩感知。压缩感知利用信号的稀疏特性,可以在远小于奈奎斯特采样率的条件下获取信号的样本,通过非线性重建算法重建信号。该技术无需采集过多的冗余数据,可以提高合成孔径雷达成像质量,极大程度减少了存储、传输和处理成本,降低了硬件的要求,因此具有很好
学位
进入21世纪以来,互联网技术、机器人技术以及虚拟现实(VR)技术等高新技术正随着人类科技的不断进步而飞速发展,机器人与操作人员之间的人机交互程度越来越高,也开始越来越多地代替人类在灾害救援、工业生产等领域发挥着重要作用。然而,当前的机器人在各种场景中实际应用时存在着机器人控制效率低、操作者沉浸感不强等诸多问题,这些问题不但影响着人机交互中的用户体验感,还制约着任务完成效率。针对以上问题,本文分析研
学位
在实际场景中,视频图像采集常受多种环境因素影响,使得采集图像在局部或全局区域照度偏低,视觉效果差。即便在有光源补充的4K内窥镜场景,也难免因腔体深度、组织遮挡等因素,导致内窥镜图像的照度不均匀。目前,已有的亮度均衡算法为了达到更好的增强效果,大多数都以更高的算法复杂度为代价,此类算法难以应用于有实时需求的场景。因此,本文围绕4K低照度视频图像的亮度实时均衡问题,展开了对亮度均衡算法的研究、并行实现
学位
中国拥有丰富的山地资源,在这类环境下进行军事作战通信、民用应急通信、地质灾害监控等工作就显得十分必要。无线通信凭借其组网灵活、扩展性强、时效性高等优点已经成为在这类环境下通信的主要手段。但是目前缺少对这类信道特性的较为系统的科学研究,造成了在实际应用场景下快速建立有效和可靠连接的困难,制约了山地环境下无线通信的发展。鉴于山地环境的复杂性,植被的类型、地势的起伏、通信站的布点位置等都会对无线电波的传
学位
肝癌是世界上最常见的癌症之一,它严重威胁人们的生命。肝脏及其肿瘤分割是肝癌治疗中的重要步骤。对腹部CT影像进行肝脏肿瘤分割是一种常规的辅助诊断手段。然而CT影像中肝脏附近存在密度与其相近的器官,并且肝肿瘤具有边界模糊、位置随机、数量不确定、形态和大小不一等特点,这些均是制约肝脏肿瘤分割效果的不利因素。近年来,针对CT影像的深度学习分割方法已有不少研究,但是这些方法在肝脏及其肿瘤分割中存在过分割、欠
学位
在航空航天、空气动力学等领域中,摩擦阻力的测量一直是研究的重点。在摩擦阻力作用下,流体运动能够表征边界层的状态变化。摩擦阻力不仅是描述湍流边界层的一个重要物理量,同时摩擦阻力对于航空飞行器的外壳设计方式也有相当重要的参考价值。本文首先对近年来的摩擦阻力测量方法展开了调查。对比众多方法选择了荧光油膜全局测量技术,以这项技术为基础开展了荧光油膜全局测厚及摩阻测量误差分析研究。首先着手于荧光油膜全局测量
学位
核素识别技术是我国核技术和核工业的发展中的关键性技术,同时也是保障国家核安全的基石,传统核素识别的主要思路是寻找核素能谱中的特征全能峰等核素的特征信息,然后将其与标准核素库中的核素信息进行匹配,从而达到识别核素种类的目的。但是由于实际测量环境中存在较多噪声污染、多种核素相互淹没与干扰,导致得到的核素能谱较为复杂,而传统的寻峰-匹配法无法满足对此类复杂能谱的识别要求,存在误差较大、鲁棒性较差和识别率
学位
相比于传统基于插值、重构及硬件设备等方法进行CT图像超分辨率重建,基于深度学习的方法能够获取纹理连续性好,感兴趣区域特征突出的重建图像,且算法的成本更低。因此本文以深度学习的图像超分辨率重建算法为基础,主要针对注意力机制,残差特征提取及图像的上、下采样技术进行分析和研究。具体内容如下:(1)提出了基于UNet特征融合的超分辨率CT图像重建(UNet SR)。首先,关于通道注意力(Channel a
学位
肺部疾病的患病人数逐年增多,改善肺部疾病的早期诊断和治疗,从CT图像中自动进行肺部分割是临床决策的一项关键任务。然而,由于肺的形状、大小不规则、对比度低和边界模糊,分割肺实质区域是一项非常具有挑战性的任务。现有方法中基于低级手工特征的方法易导致欠分割,基于CNN的浅层网络无法提取更具辨别力的特征。随着深度学习在图像处理领域取得了重要突破,将深度学习与计算机辅助诊断结合识别肺部图像成为了一个热门的研
学位
室内外空气污染已经成为现代社会普遍关注的问题。尽管在过去的几十年中,世界范围内颁布了许多关于空气质量的政策和法规,但空气污染仍然在对人类健康产生负面影响。挥发性有机化合物(Volatile Organic Compounds)是大气污染之一,它的治理问题引起了研究者的关注。二氧化钛(TiO2)半导体光催化材料具备高效无毒、稳定性好、经济环保等优势,因此使用TiO2作为光催化剂降解污染物是解决大气污
学位