【摘 要】
:
场景语义分割是计算机视觉领域的一项重要研究课题,在虚拟现实、增强现实、室内导航、自动机器人等场景都有广泛的应用。二维图像表达了场景的颜色纹理信息,三维点云或深度图表达了场景的空间结构信息。如何将颜色纹理特征与空间结构特征相融合,并在融合后的特征上进行语义分割,以进一步提高其分割精度具有重要的研究意义。本文基于深度学习将RGB图分别与深度图、点云两种不同的空间结构信息进行融合来提高特征表达能力,并对
论文部分内容阅读
场景语义分割是计算机视觉领域的一项重要研究课题,在虚拟现实、增强现实、室内导航、自动机器人等场景都有广泛的应用。二维图像表达了场景的颜色纹理信息,三维点云或深度图表达了场景的空间结构信息。如何将颜色纹理特征与空间结构特征相融合,并在融合后的特征上进行语义分割,以进一步提高其分割精度具有重要的研究意义。本文基于深度学习将RGB图分别与深度图、点云两种不同的空间结构信息进行融合来提高特征表达能力,并对融合后的特征实现逐像素的语义分割。(1)室内场景下不同目标的颜色纹理特征相似,且因室内空间小而目标之间容易相互遮挡,依靠传统RGB图像的颜色纹理信息进行语义分割容易出现分割边界不精确或误分割的情况。针对此问题,可以将深度图特征与RGB图特征进行融合,难以用颜色纹理特征准确区分的细节信息通过空间结构特征进一步区分。本文设计了一个双分支编码器的图像语义分割网络,通过两个分支分别提取RGB图的颜色纹理特征与深度图的空间结构特征,并在融合后的特征上用空洞空间金字塔池化模型来捕获不同尺度的目标特征,以提高特征的稳定性。通过卷积注意力机制对不同的特征进行加权,进一步加强特征之间的语义关联。最后在公开数据集SUNRGB-D上的语义分割结果表明,RGB图的颜色纹理特征与深度图的空间结构特征融合后进一步提高了语义分割的精度。(2)在点云的语义分割任务中,点云的三维坐标信息提供了丰富的空间结构特征,但缺乏场景下的颜色纹理特征。室内场景中的局部细节特征对分割精度的提升至关重要,并且只用三维信息很难区分挂画、窗帘等空间结构特征不丰富的目标。针对此问题,提取同一点云场景下RGB图的颜色纹理特征并与点云特征进行融合,进一步丰富场景的特征信息。本文首先用一个卷积神经网络作为编码器提取同一场景下RGB图的颜色纹理特征,再将得到的RGB图特征映射到点云空间,经过多层卷积运算可以加强特征之间的语义关联。然后将映射后的特征与点云的空间结构特征相融合,进一步提供了丰富的颜色纹理特征。最后用自注意力机制生成全局上下文信息,建立特征内部的远程依赖关系。以室内场景数据集ScanNet为对象,开展融合RGB图与点云的语义分割任务。实验结果表明,融合RGB图特征后可以进一步提升点云的语义分割精度。
其他文献
随着探地雷达技术的发展,探地雷达也逐渐向低成本、小型化、可重构的方向改进,例如在煤矿开采过程中用于灾害隐患预先探测。但是传统的探地雷达设备通常使用纯硬件的方式实现,往往存在体积大,探测灵活性差等问题。针对上述问题,论文设计了一种通用性强及开放性高的小型化探地雷达系统。依据软件无线电雷达的实现机制,设计了一种基于调频连续波的软件无线电探地雷达系统。论文在系统需求分析的基础上进行了系统建模并分析其功能
复杂网络是对复杂系统的抽象表示,其反映出复杂系统中各个个体间的连接关系。社团作为复杂网络的基本功能,普遍存在于实际网络中,通过挖掘社团结构,有助于认识网络功能和研究网络拓扑结构,以此揭示复杂网络中存在的潜在规律,预测复杂网络的演化趋势,因此对于复杂网络社团检测研究具有重要实际应用价值。专家们从各个角度入手,提出了种类繁多的社团检测算法,在基于节点相似度社团检测的这类算法中,其本质是对节点相似度的度
三维数字化牙齿模型被广泛的应用于口腔正畸领域,特别是三维数字化成像在口腔正畸诊断、治疗和疗效预测中发挥的作用。牙齿的好坏会影响一个人的气质和形象,如今不同年龄阶段的人都会存在牙齿方面的疾病或者问题。因此,利用计算机技术辅助诊断牙齿疾病,发展计算机辅助模拟矫正系统,对牙齿矫正具有重要意义。由于目前的牙齿三维模型都是口腔扫描得来的,只有牙冠和牙龈表面部分,缺少牙根部分数据,不利于牙齿模拟仿真。为了帮助
随着矿山智能开采的提出,建立煤层采动过程中覆岩变形大范围监测系统对保障矿山安全高效开采有重要作用,分布式光纤被引入矿山覆岩的变形监测中,开展了丰富的实验室和工程应用研究。但无论是实验室研究还是实际工程应用,由于分布式光纤铺设工艺复杂且铺设成本较高,难以进行密集铺设,给覆岩变形大范围监测及变形精准表征带来了困难。为解决这个问题,本文研究了基于深度学习的采动覆岩变形分布式光纤监测数据推测方法,为分布式
随着煤矿开采深度的不断增加,通风系统会逐渐变得复杂,增加了井下各工作区域风流的供应难度,使得通风系统的维护与灾害控制成为当前的主要问题。目前矿井通风系统评价主要是通过建立单一评价模型对整体进行评价,只能从宏观角度得到矿井通风系统评价结果,忽视了局部用风区域通风效果对整体评价产生的影响,使得风源性事故无法从根源上有效发现。因此,如何从微观角度建立评价指标体系及应用智能评价方法进行综合分析,成为解决问
随着高速率和多业务宽带通信技术的发展,窄带通信技术已经不能满足目前的应急通信需求,现阶段应急通信网络希望在保障关键语音的同时拥抱更多的宽带业务。当发生重大自然灾害时,原有的通信网络可能已经瘫痪无法为救护人员提供通信服务,在救灾现场迅速搭建好一套稳定健壮的应急通信网络,将有助于提高救援效率,减少人员伤亡和经济损失。因此,开发一种便携式的宽窄融合应急通信系统具有重要的意义。针对山地林区发生自然或人因灾
金属带式无级变速器(Metal Belt Continuously Variable Transmission,简称 MB-CVT)是汽车传动系统中的关键技术,符合国家对节能和减少环境污染的要求,并在国内外应用日益广泛。金属带是MB-CVT的核心部件,其生产技术长期被国外企业垄断。为打破现有局面,本团队提出了一种新型无级变速器—钢绳环式无级变速器(Wire Rope Continuously Va
软件定义网络(Software Defined Networking,SDN)作为一个新时代的网络系统架构,由于其本身具有全局视图和可编程的优势,为有效解决由于网络流量快速增长而导致的路径拥塞问题提供了可行的方法。但是传统的流量调度算法与SDN架构不能完美兼容,表现出一定的局限性。因此,本文基于SDN架构来研究网络流量的调度算法与策略,以达到实现网络负载均衡,提升网络性能的目的。本文在分析流量调度
石墨烯(Graphene)的成功制备引起了人们对二维材料的广泛关注。在随后的十几年中,很多新型的二维材料陆续被制备生来。作为一类重要的二维材料,磷烯(Phosphorene)不仅具有类似于石墨烯优异的物理、化学性质,而且还弥补了石墨烯零带隙的缺陷,成为制作场效应晶体管、半导体传感器等电子器件的理想候选材料。磷烯具有面内共价键和面外范德华相互作用的特点,可以与不同尺寸的二维材料结合从而形成混合尺寸的
预掘回撤通道在综采工作面进入末采阶段受采动影响剧烈,极易引发回撤通道围岩发生大变形而导致压架、冒顶等事故,严重制约了工作面的回撤效率。本文采用理论分析、数值模拟和现场监测相结合的方法,对预掘单回撤通道受采动影响下的围岩应力分布以及顶板变形特征进行了研究,得到了单回撤通道围岩变形破坏规律,并基于断裂力学理论提出了强制放顶控制技术。主要研究内容及结论如下:(1)在回撤通道与工作面相距较远未产生相互影响