基于深度学习的图像语义分割技术研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:laden167
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割一直是计算机视觉领域的研究重点,而深度学习是目前人工智能方向飞速发展的热点,因此基于深度学习的机器视觉方面的应用已成为学术界和工业界的研究热点之一。目前,大多数应用都是以精确有效的分割机制为前提基础的,如自动驾驶、医学分析、场景理解,虚拟现实以及增强现实等。作为计算机视觉高性能的方法,深度学习在很大程度上解决了学术研究或市场应用中包括语义分割或场景理解的任务需求。本文旨在对基于深度学习的图像语义分割技术在计算机视觉领域中的若干应用进行研究,具体内容包括:针对脊柱病理的解剖变异、植入物引起的噪声以及不同感受野产生的范围差异等问题,提出了一种基于多U-Net融合的椎骨定位与分割方法。该方法利用不同的U-Net,依次在CT图像上进行脊柱粗定位、椎骨粗定位和椎骨精准分割,实现了高度重复结构的图像分割和标记。首先,使用改进的U-Net在原图像中定位脊椎的粗略位置。然后,利用空间配置网络(SC-Net)使用热图回归进行椎骨的定位和识别。最后,设计一个具有高分辨的U-Net对每个已识别的椎骨进行二元分割,并将单个预测结果合并到最终的多标签椎骨分割中。通过在MICCAI 2019大规模椎骨分割挑战赛(Ver Se 2019)上的实验结果表明,所提方法较大部分提交的对比方法有更优的分割性能。针对不同数据集存在自身固有分布变化的问题,提出一种能够从多个数据集中学习的跨数据集协作学习方法。该方法在给定多个标记数据集的情况下,提高了每个数据集上特征表示的泛化和区分能力。首先,引入一系列数据集感知块作为网络的基本计算单元,以捕获不同数据集的同质表示和异质统计。然后,设计一种数据集交替训练机制来有效地促进优化过程。最后,在单数据集和跨数据集不同情境下,对Cityscapes、BDD100K、Cam Vid和COCO Stuff等四个不同的公开数据集进行性能评估,以验证方法的有效性。实验结果表明,与以往的单数据集和交叉数据集训练方法相比,该方法在不引入额外触发器的情况下取得了显著的改进,特别是在相同的PSPNet(Res Net-18)架构下,所提协作学习方法在Cityscapes、BDD100K和Cam Vid验证集上的m Io U值明显优于单数据集。针对多源情境下的语义分割自适应问题,提出一种基于协同学习的多源域自适应语义分割方法。该方法利用两种协作学习策略来探索跨不同领域的基本语义上下文和领域不变语义上下文。首先,引入一种简单的图像平移方法对齐像素值的分布,以在一定程度上减少源域和目标域之间的差异。然后,设计一种域自适应协作学习方法,在无需查看目标域数据集的前提下,充分利用跨源域的基本语义信息。最后,通过使用由集成模型生成的在线伪标签,限制多个自适应模型的输出,并利用未标记的目标域数据来进一步提升域自适应的性能。通过在公开数据集上的对比和消融实验结果表明,所提方法较其他最先进的单源和多源无监督域自适应方法有显著的性能提升。针对全景分割网络框架独立性以及雷达(Li DAR)点云数据的特殊性问题,提出一个基于极坐标鸟瞰图(Bird’s Eye View,BEV)的Li DAR点云全景分割方法。该方法使用极坐标下的鸟瞰图表示在单个推理网络中学习语义分割和类不可知实例聚类,以避免城市街道场景中实例之间的遮挡问题。首先,通过投影和量化操作创建固定大小的极坐标BEV编码,用于处理包含随机大小的点云数据。其次,利用一个包含4个编码层和4个解码层的U-Net作为基本网络,并按照Polar Net方式对编码后的Li DAR点云数据进行语义分割。然后,在语义分割的基础上,构建一种无提议的Li DAR全景分割网络,有效地实现实例聚类分割。最后,设计一种改进的实例扩充技术和对抗性点云剪枝方法,以提高网络的可学习性。通过在Semantic KITTI和Nu Scenes数据集上的实验结果表明,所提方法在保证实时预测速度的前提下,较基线方法具有更优的性能。
其他文献
本文概述了云计算,之后对云计算常见的体系结构和边缘云计算的体系结构进行分类分析,最后对云计算系统和边缘云计算系统的数据迁移方法策略进行分析,希望对我国边缘云计算系统的推广使用提供一定帮助。
基于深度学习的伪装目标检测是一项新兴的视觉检测任务,其目的是精确且高效地检测出“完美”嵌入周围环境中的伪装目标。目前大多数工作旨在构建不同的伪装目标检测模型,对现有模型的归纳总结及深入分析的综述性工作还很少。因此,对基于深度学习的伪装目标检测模型进行了全面分析和总结,并探讨了伪装目标检测未来的研究方向。首先对基于深度学习的23个伪装目标检测模型分别从由粗到细策略、多任务学习策略、置信感知学习策略、
基于深度学习的目标检测技术已广泛应用于移动支付,自动驾驶和安全保护等许多领域,但是在实际电力安全作业检测、高空无人机垃圾检测和震灾房屋损坏检测等应用中仍然存在许多挑战:如小目标检测,遮挡目标检测和应用的实时需求。针对以上问题,本文研究分析多尺度深度特征融合信息使骨干网络提取的不同特征层之间进行信息传递过程,从而获得包含不同尺度层的目标空间位置特征以增加预测目标位置和类别的语义信息。使用有限的相邻特
对未知小天体准确的环境感知是探测器安全软着陆的先决条件。随着人工智能与多源数据融合技术的快速发展,智能化的小天体探测器将具有更为强大的环境感知能力与适应能力。为了克服当前单一观测手段存在感知视野受限、场景适应性及抗光照能力差等问题,本文采用相机与激光雷达作为信息观测源,对多源数据融合的小天体环境智能感知算法进行深入研究。论文主要研究内容如下:首先,对基于光学图像的小天体表面地形特征智能检测算法进行
本文阐述了“互联网+”技术结合知识图谱模式挖掘档案信息的深层关系,提出了知识服务时代档案建设的实施策略,旨在充分发挥信息化技术带来的优势,为档案建设的创新性发展提供理论参考。
<正>改革开放四十余年,建筑行业已经成为国民经济支柱产业,人们对工作、生活和居住环境的要求也在不断提升。“十四五”期间,中央和地方各级政府陆续出台了关于智慧社区、智慧园区和智慧城市的引导和扶持政策,推动、加快政府和各行各业向数字化全面转型。智慧建筑是构成智慧社区、智慧园区和智慧城市的基本细胞,如何通过智慧建筑的设计营造符合时代发展的绿色、舒适、高效、安全、智慧的人居环境,是每一个建筑智能化从业者需
期刊
随着刑事合规改革的推进,单位犯罪不起诉制度作为合规激励措施重新走入大众视野,检察机关先后开展两期刑事合规试点工作并出台系列文件、方案指导单位合规,在改革试点地区,出现了以刑事合规为基础对涉罪单位作出不起诉决定的做法,并形成了“检察建议+不起诉模式”与“合规考察+不起诉模式”两项改革成果。“检察建议+不起模式”是在考察涉罪单位刑事合规意愿基础上,对涉罪单位进行酌定不起诉,并发出刑事合规的检察建议。“
三维车辆检测是车辆自动驾驶过程中的基础和核心任务,对于保证行车安全十分重要。近几年,随着深度学习理论和传感技术的快速发展,三维车辆检测方法的检测性能得到了极大的提升,然而距离其在实际交通场景中应用还面临两方面的挑战,首先是检测方法的检测精度还无法满足自动驾驶的需求,主要体现在遮挡及远距离车辆目标的漏检率和形似车辆目标的误检率还较高;其次是现有的检测方法也不能很好地满足全天候场景检测的需求,各检测方
<正>感悟努力成为居民的朋友和伙伴,伴随着街区和社区一点一滴的更新发展,希望处处都有微花园。《北京城市总体规划(2016年-2035年)》和《首都功能核心区控制性详细规划(街区层面)(2018年-2035年)》中提出了“开展留白增绿、补齐短板、改善环境、提升品质的城市修补工作”和“推动老城整体保护与复兴,完善绿地体系,开展绿化美化建设,让街巷胡同成为有绿荫处、有鸟鸣声、舒适的公共空间”等指导意见~
期刊
目标检测是计算机视觉、人工智能等领域的重点研究方向之一。该方向的主要任务是对图像中多个感兴趣的目标进行定位和识别。目标检测技术的研究成果广泛应用于行人检测、人脸识别、遥感检测和车辆检测等领域。传统的目标检测方法总是假设训练数据和测试数据遵循相同的分布,但现实生活中很难满足这种假设,因为训练数据和测试数据通常是在不同的环境中进行收集的。为此,领域自适应目标检测方法被提出用来解决分布不一致场景下的目标