基于FCN的城市无人机图像语义分割

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:wang540364472
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来无人机技术的发展,搭载视觉传感器的小型无人机以其小巧便捷、成像迅速、成本较低等优势在各行各业得到了越来越多的应用。然而,对其所获取图像的语义分割技术的欠缺仍是限制其进一步应用的瓶颈之一。本文以无人机城市图像的语义分割任务为研究对象,结合卷积神经网络与概率图模型的相关思想,提出了适用于无人机城市图像语义分割的模型,并将此模型通过深度迁移学习应用到机载遥感城市图像的语义分割任务中,具有重要的理论意义和应用价值。本文主要工作与成果如下:
  (1)针对城市无人机图像拍摄中传感器与目标距离远、角度大导致的图像中目标小、背景杂等问题,提出了一种基于卷积神经网络的融合FCN模型,该模型的两个支路同时接收无人机图像与其对应的数字表面模型作为网络的输入。同时,提出了在融合FCN网络模型中的数字表面模型支路的捷径结构与两个支路融合时的HCI融合方法,目的是更有效率地同时利用图像细致的纹理信息与数字表面模型中包含的潜在的位置信息;
  (2)针对基于卷积神经网络的模型结构固定,像素与像素之间的关联被限制在卷积核的范围之内,使得其像素点与像素点之前缺乏长程依赖这一问题,提出了一种基于条件随机场的图像语义分割后处理算法,并结合多尺度分析与注意力机制,在由无人机图像与由数字表面模型上采取不同的自适应权值,以细化前级分类器输出的初级语义分割结果;
  (3)针对无人机飞行范围较小而导致的地表分析能力较弱的问题,提出了一种将融合FCN模型通过深度迁移学习应用在机载遥感图像语义分割的方法,以实现低空、分辨率高、但范围小与高空、范围大、但分辨率低,两者相矛盾的地面分析能力。在数据、特征、任务三个层面上对深度迁移学习的可行性进行了详细的分析,同时讨论了在深度迁移学习中源域与目标域差距较大时负迁移现象的产生。提出的方法减少了模型的训练时间,增强了模型的可重用性。
  综上所述,本文实现了对无人机城市图像的语义分割,并迁移到机载遥感图像的语义分割任务上,为后续诸如无人机自动飞行、着陆点判断、目标跟踪与高/低空地表分析任务提供了基础。
其他文献
分布式发电技术是对传统集中单一式供电系统的补充,是社会节能环保的重要助力。近年来,分布式并网发电技术逐渐成为研究热点,愈发为人们所重视。由于孤岛产生可能造成电力设备严重损坏或相关人员的重大伤亡事故,所以,孤岛检测是并网逆变器型分布式发电系统在实现并网前务必要解决的技术问题。孤岛发生后必须快速将其检测出,并迅速将分布式电源从主网中切除,所以对分布式发电并网孤岛检测方法进行研究有着十分重要的意义。  
合成孔径雷达具有全天时、全天候的成像能力,近年来被广泛应用于战场侦察和情报获取。传统的SAR图像目标识别方法由于其复杂的过程,限制了识别效率与精度的提升。卷积神经网络在图像识别领域展现出了良好的性能。本文在深度学习的理论框架下,研究了基于深度卷积神经网络的SAR图像目标识别方法,主要研究工作如下:1.介绍了传统的SAR图像的识别方法和基于卷积神经网络的SAR图像识别方法。因SAR图像的相干斑噪声会
学位
无论是在军事上还是民用上,雷达对海面目标的检测都具有重要的意义。然而,海洋环境的复杂性以及海面目标的多样性给海面目标检测造成了一定的困难。机器学习是近年来的研究热点,随着相关理论的不断发展,其应用领域越来越广泛,并已运用于雷达信号处理中。本文先是从经典的机器学习算法出发,通过不同的特征提取方式分别讨论了支持向量机算法(Support Vector Machine,SVM)、K近邻算法算法(k-Ne
学位
合成孔径雷达(SAR)是一种高分辨率成像雷达,具有传统光学成像和红外遥感不具备的全天时全天候工作的特点。视频SAR是对经典SAR成像模式的扩展,继承了传统SAR的优点,同时又有效的扩展了时间维的信息,具有更强的动态信息获取能力。视频SAR将SAR成像技术与视频显示技术相结合,获得连续的SAR图像。论文主要对基于FPGA的视频SAR成像进行研究。本文所做的工作与创新如下:1.针对传统极坐标格式算法存
学位
本文设计了一套适用于2米超声速风洞的导弹虚拟飞行半实物仿真控制系统,与风洞模型支撑装置一起构成导弹风洞试验系统。该系统集指令收发与控制、数据采集与处理、数据分析与显示于一体,为综合研究导弹飞行过程中的运动特性和气动特性提供重要保障。首先,在分析和论证风洞虚拟飞行试验系统方案设计可行性的基础上,根据系统性能和技术指标要求,提出了导弹虚拟飞行半实物仿真控制系统的总体设计方案。基于工业控制计算机和PXI
学位
随着数字图像成像技术的发展,各类新型医学影像拍摄设备日渐普及,医学图像也逐渐成为医生临床诊断的主要依据。传统诊断流程需要医生在观察分析病灶的同时给出诊断结果,一些发病率较高的疾病往往需要临床医生花费大量时间和精力重复地进行观察和诊断,且诊断结果容易受到医生主观因素的影响。因此,一个能够实现图像分割、定位和分类等功能的自动化医学图像分析系统具有重大的临床意义。近几年,机器学习方法和深度学习方法在医学
学位
本文鉴于单通道星载SAR成像和多通道星载SAR高分宽幅成像系统各自的利弊,提出了一种基于双通道收发分置的星载SAR高分宽幅成像方法,其中结合推导的四种信号重构算法,对方位向产生的模糊进行了抑制。然后将地面动目标的相关参数添加到高分宽幅成像的信号重构滤波向量中,推导出了动目标自适应的信号重构滤波向量,并结合相位中心偏置天线算法(DPCA)和空时自适应处理算法(STAP)两种杂波抑制算法,研究了基于高
学位
随着车辆、接入设备的增多以及大量新型无线网络业务的出现,车联网(Internet of Vehicle,Io V)对无线频谱资源的需求日益增长,使得现有固定分配给Io V的频谱资源严重匮乏。针对这一问题,在Io V中引入认知无线电(Cognitive Radio,CR)技术,构建认知车联网,以实现频谱资源的按需动态分配,进而提高频谱利用率。论文针对认知Io V中存在传输协作频谱感知结果时可能出现差
学位