基于深度学习的遥感建筑物图像语义分割技术应用研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:zydwnj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球范围内遥感卫星技术的突破与发展,获取的遥感图像所包含的信息也愈加丰富与清晰,其记录的地物纹理、几何、色彩等信息,能够为城市规划、地震救援、交通规划等重大工程提供必要的基础性数据。近年来,虽然遥感图像建筑物的提取研究有所发展,但鉴于建筑物形态特征具有随时间、地域、审美等因素变化的特性,并没有一个绝佳的方法能与之适配,遥感图像建筑物的提取仍面临诸多挑战。利用传统方法对遥感图像建筑物信息进行提取,通常会存在人工成本损耗大和精度不高的局限,因此,将深度学习技术应用至遥感或航天图像建筑物的提取具有广泛的意义。通过查阅国内外相关文献,结合遥感图像建筑物特点和卷积神经网络原理,本文提出了一种多尺度融合的变形残差金字塔网络(Multi-scale fusion of Deformation Residual Pyramid Network,MDRP-Net)。该网络首先通过引入深度编码网络和增加网络特征传递路径的方式,对Unet模型结构进行改造,将原单一串行网络结构改变为以深度编码网络为主、下采样旁路网络为辅的双路径特征提取网络。然后在编码网络末端引入一种以可形变卷积网络提取的特征为总输入、不同尺度特征间使用残差模块进行连接的金字塔网络结构,增强网络对建筑物轮廓多样和尺度多变的适应能力。最后,使用联合上采样解码器以完成对遥感图像建筑物特征的解码和识别任务。在公开的遥感建筑物数据集Mnih上进行了对比实验,结果表明,引入的两种网络结构均能在原Unet模型基础上提高分割精度,且两者共同使用时分割精度最高,在F1和MIoU评价指标上分别为0.870和0.784。在自制的数据集上,主要对比了MDRP-Net模型使用随机擦除预处理前后的分割性能对比实验。首先利用Local Space Viewer平台截取谷歌公开的遥感图像,并自制广州市大学城建筑物二分类数据集,然后通过修改随机擦除生成策略,对自制数据集进行预处理,最后,设计对比实验并选取三种类型的测试区域对模型进行预测,针对预测结果进行了综合的分析与评价。
其他文献
基于视觉信息的目标识别与定位相关技术在工业应用等领域中扮演着重要角色。前期出现的单目视觉方案具有实现过程简单快速的特点,然而此类方案往往无法直接获取目标的距离和位姿等,目标辨识和空间定位任务所需的关键性信息。后期出现的双目视觉方案则模拟出人类视觉系统,所以其天然具有获取空间场景信息的能力和特点,只是目前已有的方法在实现速度与精度方面常常无法得到很好的兼顾,主要瓶颈在于图像目标特征的提取、描述和匹配
随着科学技术的发展,智能机器人已经成为人们日常生活中重要伙伴。然而,机器人技术仍存在许多不足之处,其中在路径规划方面尤为突出,相关学者对之也发起了挑战,并提出了许多优化传统路径规划算法的新方法。传统全局路径规划A*算法和局部路径规划动态窗口法算法,能完成简单的导航任务,但是还存在着一些问题。如传统A*算法规划路径的过程中,节点等概率扩展带来的冗余节点数,导致Openlist容器节点占用率过高;可行
随着人们生活的发展,肺部组织的致病率也随之增长。胸片检查是判断肺部疾病的重要途径。但胸片的人工检查工作存在着工作量大、专业性强且依赖于医师的临床诊断经验等问题。面对这些问题,目前的主要解决方法是采用基于大数据、人工智能开发的计算机辅助诊断。现有的辅助诊断肺病的人工智能算法大多不仅存在着图像预处理针对性不强、图像分析的分类性能较差和结果准确度不高等问题,而且现有算法对新发现的肺部疾病判断率偏低,如新
这些年来,半导体光刻技术有了快速发展,以及集成电路在往小型化方面的快速发展,对光刻研究者的研究有更高的要求,即光刻人以更精确的工艺流程和创新来突破光刻技术的极限。因而,各式各样的模拟仿真器件也被研发出来,一种比较传统的方法,是基于薄掩膜的近似方法,有时候也被称为基尔霍夫方法(Kirchhoff Approach),然而,这种方法并不适合用于计算三维立体掩膜的空间像。经过查阅相当数量的光刻有关文献,
随着现代社会的设备复杂度越来越高,同时因为设备的精度提高,设备成本变得越来越昂贵,如果设备发生故障,对生产人员的生命安全和设备的损失将会造成不可估量的影响,因此,对设备的故障诊断研究是具有理论价值与实际价值的。现实中大部分的现象是以非线性的状态呈现的,因此当设备的复杂度越来越高时,根据现实设备建模的非线性系统,其非线性程度也可能越来越高,设备的复杂度高还带来对系统建模精度降低这个巨大的挑战,因此,
文字是人类用表意符号记录表达信息以传之久远的方式和工具,是信息传递的载体。自然场景下端到端文本检测与识别算法的应用越来越普遍,已广泛应用于车牌识别、票证识别等场景,背景单一、规律整齐、水平方向的普通文本文档的识别率非常高。然而,在自然场景下文本的识别率较低,如有的图像中文字镶嵌在建筑、花草、服装中,有的图像中文字大小不一样,有的排列紧密稀松不一致,有的图像受到拍摄和采集的限制,照片明暗度、清晰度角
在实际工业生产中,系统往往存在未知外界干扰和系统内部参数漂移等不确定性因素的影响,在此背景下,如何实现对不确定系统的控制一直都是控制领域的重要研究方向之一。实际系统与建模所得数学模型之间往往存在一定差距,这类差距是由于未知外界干扰以及无法建模的系统动态而引起的。而滑模控制作为当代控制理论的重要方法之一,其实现方法相对简单及对不确定性和干扰的强鲁棒性,因此,得到广泛了的研究,并取得了许多引人注目的成
随着工业智能化的发展与智能工厂的构建,目前工厂内部材料的运输逐渐由原先的人工搬运转变为智能运载车的搬运,以实现一体化的智能生产。但智能运载车在运行过程中可能会出现诸如偏轨等各种各样的问题,而针对运载车的异常排查,目前采用较多的是人工巡查或监控视频观察的方式。人工巡查容易出现漏查和应急响应不及时的问题,且在危化品环境下,人工巡查存在严重的安全隐患;而使用监控视频观察的方法则需要专人24小时监控,违背
以煤炭为主要的能源结构是造成我国环境污染,尤其是雾霭等恶劣天气的主要因素。2020年,在联合国大会上,我国明确提出争取在2030年前碳排放达到峰值,在2060前实现碳中和。为实现这目标,就需调整能源结构,通过发展绿色电力对经济予以更多的支持。目前,大力发展可再生能源已形成了共识,全国掀起了风电、光伏发电项目建设热潮。伴随可再生能源并网比例的不断提升,怎样保障电网频率稳定和电网安全已成为新的挑战。储
脑干是维持人体心跳、呼吸、消化、体温、睡眠等功能的基础性生理组织,对于维持人体生命具有极度重要的作用。同时脑干也尤其脆弱,直接或间接地受到外界或者自身的刺激,都很容易产生病变或者受损。通过脑部医学影像,确定病变区域并对其进行准确勾画是诊断和治疗脑干病变的关键步骤之一。所以准确快速地自动识别并且分割脑部序列MR图像中的脑干区域,对于诊疗头部软组织及其附属生理组织的疾病具有重要价值。针对当前MR图像中