面向街道场景的多分支语义分割算法研究

来源 :天津师范大学 | 被引量 : 0次 | 上传用户:vacer2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的不断发展,卷积网络语义分割方法逐渐进入人们的视野。相比于传统的图像处理手段,卷积网络不仅提高了性能,而且缩减了特征标注的人力。随着大数据时代的到来,海量的图像数据要求快速、准确的分割并识别图像的种类。图像的语义分割是对图像中每个像素点进行分类,并依据每个像素点的类别,用不同颜色描绘一幅分割图。图像的语义分割和目标检测在自动驾驶、医学、自动监控等领域有着广泛的应用。
  本文研究了高精度多支路细化的语义分割网络(Multi-Path Refinement Networks for High-Resolution Semantic Segmentation,RefineNet)和金字塔场景解析网络(Pyramid Scene Parsing Network,PSPNet),并设计了特征提取模块和多分支加速模块。本文主要工作:
  1.分析RefineNet方法,其使用不同大小的原图向网络中添加了语义信息。本文也将不同分辨率的原图输入PSPNet,为之后的特征融合提供更多的信息。
  2.分析残差网络特点和优势,本文设计多支路特征提取模型。其在第5个卷积层使用双支路对特征进行提取,后将双支路的特征堆叠,融合更多的局部信息,提高分割的准确率。
  3.基于金字塔进行多尺度特征提取的特点,PSPNet通过平均池化改变特征图的大小,融合不同程度的特征图。本文对比了网络在不同尺度下的分割效果。
  4.针对现有模型训练时间较长的问题,本文设计了一种多分支加速网络。其在第1个卷积层使用三分支网络对特征进行提取,从而加快了网络训练。另外,本文还对比了不同支路对模型性能的影响。
其他文献
近年来,卷积神经网络(CNN)在高光谱图像分类领域被广泛应用,其中3D-CNN可针对高光谱图像图谱合一的三维数据特点,同时提取高光谱图像的空谱联合特征,已被证明是一种有效的分类方法。但在运用3D-CNN进行高光谱图像分类时还存在以下问题:1.基于3D-CNN的分类方法需要一个大规模标注的数据集来训练网络,样本数量不足会导致网络产生过拟合现象,降低分类效果。2.光谱信息冗余、存在干扰像素,3D-CN
随着海洋领域的大力发展,声隐身性对于海上工作有着至关重要的作用。开展水下声源定位研究,确定水下声源所处空间的分布情况,研究不同类型声源对水下平台的影响,是进行减振降噪的一个重要过程。随着减振降噪技术的不断发展,水下平台自身辐射的噪声水平越来越低,若仍使用在远场条件下对水下声源的分析方法已经不能准确地获得声源位置信息。相较于窄带声源,宽带声源可以携带更多信息。因此,研究宽带声源的定位方法具有特别重要
学位
随着指纹识别技术在国内外快速发展并被各个领域所应用,人们对指纹识别系统性能的要求也愈来愈高。虽然指纹识别系统已相对成熟,但现有的提取指纹方向场的算法仍然存在问题,指纹图像在曲线角度特别陡的区域方向信息不连续以及没有办法进行准确平滑,在脊线中存在一些空洞或者在谷线上有不定数量的斑点情况下,对于离散类指纹图像无法起到很好的提取效果。本文为解决上述问题,提出一种改进的指纹方向场提取算法。本文根据干涉图样
学位
图像配准不仅是图像融合和三维重建中非常重要的中间步骤,同时也在遥感图像和医学影像领域中受到越来越多的关注。因此,对图像配准的方法进行研究具有重要的理论价值以及现实意义。在传统方法使用整幅图像进行配准时,引入无关区域的干扰,并且特征点匹配存在精度不足的现象,为此本文提出基于Faster RCNN的图像配准算法。本文通过改进的Faster RCNN神经网络对参考图像和浮动图像进行感兴趣区域提取,减少了
学位
森林火灾破坏性大,严重威胁森林的安全。传统的森林火灾检测方法主要是通过各种传感器对区域内温度、光谱、烟雾颗粒、可燃气体含量等指标进行检测,然而,这些感应设备存在信息量损失大、稳定性较差和实时信息无法存储等缺陷。而基于图像处理技术的森林火灾探测技术可以有效弥补传统探测方式的弊端,实现对森林火灾的实时监测。  本文针对森林火灾图像识别问题,在深入研究林火图像特点的基础上,采用脉冲耦合神经网络(PCNN
学位
野外火灾的发生,每年都会造成巨大的经济损失甚至危害人类的生命安全。由于野外森林面积大,环境干扰强,导致与传感器相关的火灾检测技术具有成本高、检测范围有限以及易老化等缺点,因此并不适用于野外火灾检测的场景。然而,随着视频监控技术的发展和相关技术的普及,针对野外火灾检测的研究逐渐开始向视频检测和识别的方向发展,这使得动态烟雾检测技术具有重要的研究意义。为了尽可能的扩大野外监控视角及范围,监控获取的须是
随着人工智能的快速发展,像人机交互、语音识别等这些需要语音参与的场景都离不开语音增强这种前端技术的支持。除此之外,复杂噪声场景下的语音信号如何在有效去除噪声的前提下同时提高语音的质量,从而符合人耳的听觉特性,这正是语音增强所需要探讨的核心内容。现有的语音增强算法在弱背景噪声下能够取得较好的效果,但是随着噪声环境的改变,比如复杂场景的切换和输入信噪比的急剧下降,如何使得语音增强算法能够平衡去噪效果和
学位
近年来随着人们不规律的生活饮食习惯,人们长期处于亚健康状态,导致了心脑血管疾病的突发几率也逐渐增加。为此本论文设计了一个通过实时检测人体生物信息并且将采集到的数据通过蓝牙模块传输到移动手机端,手机端经过预处理将数据发送至服务器的系统。在服务器端对信息进行处理,进而用来预测心血管系统健康风险,保证心血管系统的健康。本论文给出了基于脉搏波和六轴姿态传感器的人体生物信息实时监测系统,主要包括脉搏波采集、
学位
图像分割技术是各种医学图像应用的基础,分割质量的好坏直接影响图像处理的后续步骤。近些年来,随着计算机技术的快速发展,医学图像的成像方式更为丰富,提供的信息量也越来越多,为临床医学提供了巨大价值。Otsu阈值法是图像分割方法中最简单、直接、快速的分割方法,具有原理简单、易实现的优良特性。但是对于复杂图像,获取阈值的速度以及阈值质量都受到了限制,因此医学图像的阈值分割应用依然很少。为了提升医学图像阈值
眼底血管的自动分割对缩短糖尿病视网膜病变的诊断周期具有重要意义。人体眼部组织结构复杂且眼底图像在采集过程中因光照不均易混入噪声,导致现有的分割算法对血管的分割精度不高。为了解决这个问题,本文采用改进水平集的血管分割算法对眼底图像进行处理,处理过程分为预处理、血管增强和血管分割三个阶段。1.针对眼底图像存在噪声和视盘干扰的问题,对图像进行预处理。选取绿色通道图像作为待处理图像,通过灰度校正和同态滤波
学位