【摘 要】
:
随着自动驾驶和机器人技术的广泛应用,激光雷达传感器已成为现代自动系统不可或缺的设备。与传统的视觉相机相比,它可以捕获更精确、范围更广的测量值,因此受到了极大的关注。激光雷达传感器的测量自然形成三维点云,它可以帮助自动系统理解周围的环境。点云场景的语义分割对于驾驶场景理解至关重要,它旨在识别每个三维点的语义类别,例如汽车、卡车、行人等,从而提供的场景感知信息,是一个关键且具有挑战性的问题。本论文针对
论文部分内容阅读
随着自动驾驶和机器人技术的广泛应用,激光雷达传感器已成为现代自动系统不可或缺的设备。与传统的视觉相机相比,它可以捕获更精确、范围更广的测量值,因此受到了极大的关注。激光雷达传感器的测量自然形成三维点云,它可以帮助自动系统理解周围的环境。点云场景的语义分割对于驾驶场景理解至关重要,它旨在识别每个三维点的语义类别,例如汽车、卡车、行人等,从而提供的场景感知信息,是一个关键且具有挑战性的问题。本论文针对大规模室外激光雷达点云场景的特点,对激光雷达场景的语义与几何关系进行了研究与探索,主要的成果如下:1.针对激光点云分布稀疏、数量众多且排列不规则的问题,提出了一种基于体素的轻量级激光雷达点云语义分割方法。使用了一种圆柱体素化方法,让点云在体素中分布地更加均匀。采用多层级体素内特征融合模块,在分辨率不同的体素内部融合点云的特征,扩大感受野。通过记录点云到体素的映射关系使得特征聚合步骤非常高效,节省了查找近邻的时间。最终使用基于三维稀疏卷积的U-Net网络得到语义类别。在公开数据集上进行的实验表示,所提出方法能够在仅使用少量参数和极快的推理速度的情况下一次处理多帧点云,与同期方法相比具有一定的优势。2.为了探索场景的语义信息与几何信息之间的联系,提出了一种室外场景补全方法。场景补全旨在从稀疏、不完整的点云中恢复出完整的语义场景。使用原始点云作为输入,设计了一个端到端的语义分割辅助的场景补全网络。网络包括一个二维补全分支和一个三维语义分割分支,通过分层融合两个分支之间的语义特征,可以得到良好的语义补全场景。此外,分割分支的解码器部分作为辅助模块,在推理阶段可以被丢弃以减少资源消耗。在公开数据集上的实验表明,所提出的方法在补全效果上超越了同期的先进方法,并且在推理速度上可以达到20FPS。3.将所提出的语义分割网络应用于全景分割任务中,为自动驾驶系统提供更加完整的感知解决方案。根据激光雷达点云的采集方式,采用了一种基于激光雷达扫描线的实例分割方法对事物类别(things)进行划分。得益于良好的语义分割结果,全景分割方法在取得良好效果的同时保持了快速的推理时间。
其他文献
钢铁作为基础的原材料,是现代生活不可缺少的必需品,高炉炼铁作为大型炼铁系统中关键工序,其运行的稳定性决定了整个炼铁系统的运转效率和质量,因此快速准确地对高炉故障进行检测和识别对于高炉乃至整个炼铁系统稳定运行有着重要意义。高炉本身作为一个复杂的大型系统,其准确的机理模型难以建立。数据驱动的高炉故障诊断方法由于不需要准确的过程机理模型,而得到了广泛的使用。有别于高炉故障检测方法,有监督的高炉故障分类算
随着国内港口集装箱吞吐量的不断增长,提升集装箱码头整体工作效率的需求日益迫切。集卡和场桥作为集装码头水平运输和堆场作业的主要设备,通过智能调度策略弥补人工调度策略存在的不足,提高作业设备的工作效率,对集装箱码头发展具有巨大的现实意义。本文以国内某大型集装箱码头集卡和场桥的调度情况为研究背景,对各个调度子系统和系统之间的耦合性进行详尽分析,设计了基于动态分杆的集卡与场桥联合调度方案,并通过仿真验证方
火电机组因煤炭存储量大、技术要求低、基础设施完备等原因一直是我国电能产生的主体,煤炭燃烧不可避免地产生有害气体,其中,氮氧化物(NOx)是火电机组烟气中主要污染气体之一。近些年,随着环保意识的提升与排放政策的收紧,基于选择性催化还原(SCR)的脱硝技术被广泛使用于火力发电厂,SCR脱硝系统的控制优化也成为了研究热点。SCR系统入口氮氧化物浓度是脱硝控制的重要输入量,但是由于检测系统固有的分析时延,
癫痫是由脑部神经元异常同步化放电所导致,以突发性、重复性和短暂性为临床特点,是一种常见的神经系统疾病。脑电图可以反映大脑内部的状态,利用脑电预测癫痫发作问题是癫痫检测的常用手段,另外随着计算机技术的发展,通过深度学习的癫痫发作自动检测研究越来越成为癫痫临床研究领域的热点问题。长短期记忆网络(Long Short-Term Memory,LSTM)是一种时间循环神经网络,它是为了解决循环神经网络(R
带有目标追踪功能的移动机器人在未来的安防、军事等领域将会有着广泛的应用。球形机器人是一种外壳为球形的特殊机器人,在其内部封装有运动部件和部分传感器,通过重心偏移等原理,可以全密封、高速、稳定地运动,对复杂环境适应性强。球形机器人低视角,外壳遮挡,背光等原因会导致传感器数据质量不高,且计算资源存在限制,对感知算法的性能提出了更高的要求;其滚动的运动方式,需要适配专门的运动控制算法来进行轨迹规划与跟踪
随着智能家居、智能安防、自动驾驶等领域的快速发展,工程上迫切需要将深度神经网络部署到各种嵌入式设备中,如冰箱、电视、摄像头、车载电脑等等。然而,目前嵌入式设备部署应用深度神经网络面临着模型参数量大、设备环境复杂等困难。因此,本文针对嵌入式设备部署应用深度神经网络所面临的问题展开了具体研究。首先,针对深度神经网络难以在资源受限的嵌入式设备上高效存储和运行的问题,本文以网络量化为基础,提出了基于标量量
计数数据是一种重要数据类型,广泛存在于众多学科与工程领域。计数数据的观测值以非负整数的形式表示,属离散变量。其非负整数和离散特征,决定了有必要建立离散计数数据回归模型,以探究影响事件发生率的关键因素和实时预报事件的发生次数。工业过程正朝着大规模、复杂化的方向发展,所产生的测量数据呈指数级增长,以过程变量预测质量变量的软测量技术应运而生。目前计数数据建模在工业领域的应用尚不成熟,将传统的软测量方法运
随着科技的发展和需求的提升,将机械臂应用于复杂环境中并实现人机协作已成为新的趋势,这就要求机械臂在执行目标任务的同时能够实现避障等次要任务,而避障问题一直是人们的关注重点和研究热点。本文以七自由度冗余机械臂为研究对象,提出了一种新的实时避障方法,解决机械臂的传统避障算法在动态环境下避障实时性不佳的问题。首先,建立七自由度机械臂的运动学模型。通过随机均布采样方法求解并分析机械臂的工作空间,并根据七自
随着人工智能的飞速发展,多媒体数据的类型开始蓬勃发展。在此背景下,跨模态检索引起了越来越多的关注。跨模态检索的目标是在给定一个模态的查询实例的情况下,检索另一模态的实例,为不同类型的多媒体数据提供互相检索的能力。然而,当下的多媒体数据量正在迅速增长,快速高效的实现跨模态检索成为了一个巨大的挑战。为了解决这个问题,研究人员提出了许多基于哈希的方法来实现快速高效的跨模态检索。因此,本文对跨模态哈希的关
《北京城市总体规划(2016年-2035年)》中提出了以首都核心区为建设核心的城市空间结构要求,即将东城和西城作为北京政治文化发展的核心承载区、历史文化名称保护的重点地区及彰显国家形象的重要窗口。与此同时,“十三五”发展规划及建设北京“设计之都”的战略部署要求,提出了发挥设计在城市建设中的引领作用。在此背景下,公共设施作为城市建设的重要组成部分,其智慧化建设和管理水平的提升对完善智慧城市建设具有重