【摘 要】
:
近年来,自动驾驶技术逐渐成为学术界及工业界研究的重点,而车载移动激光雷达获取到的三维点云数据,是智能车辆感知周围环境的关键信息。由于雷达传感器与物体的相对位置、物体的自遮挡与物体间的相互遮挡,使得采集到的数据中无法获得完整的车辆点云。为了更精准地感知环境,需要借助三维补全技术来获得更完整的、更高质量的点云数据。随着相关研究的逐渐深入,许多基于深度学习的三维补全模型相继出现,但这些研究大多在合成数据
论文部分内容阅读
近年来,自动驾驶技术逐渐成为学术界及工业界研究的重点,而车载移动激光雷达获取到的三维点云数据,是智能车辆感知周围环境的关键信息。由于雷达传感器与物体的相对位置、物体的自遮挡与物体间的相互遮挡,使得采集到的数据中无法获得完整的车辆点云。为了更精准地感知环境,需要借助三维补全技术来获得更完整的、更高质量的点云数据。随着相关研究的逐渐深入,许多基于深度学习的三维补全模型相继出现,但这些研究大多在合成数据集上完成,迁移到真实数据上时往往效果会下降。在保证补全模型效果的基础上,进一步提高模型的精确度与可信度,对于实现复杂道路场景下的自动驾驶具有重要意义。针对这个问题,本文提出了一个面向车辆的端到端三维点云质量评价及补全模型(Point Voxel Completion Network,PVCNet),具体工作如下:1.构建车辆的仿真雷达扫描数据集。通过分析真实道路环境下车辆的点云数据特征,仿真激光雷达的扫描方式,自动生成贴近真实数据的仿真数据,为提出的深度学习框架PVCNet提供足够的训练数据。2.设计点云数据质量评价体系。围绕真实数据点云密度不一致、遮挡程度差异大的现象,设计自动的点云质量评价体系,结合点云的形状、密度等信息,进行点云质量评估,为点云补全结果提供置信度参考。同时,初步预测缺失点云的位置信息,并以特征向量的方式传递到最终的补全模块中。3.提出面向道路车辆的点云补全模型。针对道路场景中车辆的点云数据特点,在三维重建损失的基础上,设计了法向量损失和主方向损失,同时,结合点云数据与体素数据的优势,提升针对道路场景中车辆的点云补全效果。通过在不同场景、不同任务中进行多项实验,证明了本文提出的PVCNet框架在面向道路车辆的三维点云补全任务上具有良好的效果,并在多类别点云物体的补全任务上,也展现出具有竞争力的表现。
其他文献
立体视觉对象的表示与识别在工业制造与智能交通中扮演着重要的角色,因此吸引了学术界的广泛关注。立体视觉对象常见的表示形式有:点云、视图、体素、网格等。对于立体视觉对象,不同的表示形式有着完全不同的数据组织结构,因此使得立体视觉对象的学习任务难度大增。特别是在多模态的联合表示学习上,不仅要解决单一模态的学习问题,还要提出合适的框架去融合不同模态的数据表示,从而达到对立体视觉对象更加精准的多模态联合刻画
谣言的广泛传播对社会的危害性极大,轻则侵犯公民或社会组织的个体权利,重则造成社会恐慌,摧毁社会信任体系,甚至危害国家安全。很多学者研究了辟谣的相关方法,然而目前的辟谣工作仍然需要大量的人工干预,存在着工作内容繁琐、辟谣时效性滞后等问题。辟谣文本生技术能够极大降低辟谣工作的人工成本和时间成本,是及时抑制谣言传播、有效降低谣言社会危害性的关键技术。然而,目前关于辟谣文本生的方法还鲜有学者研究。辟谣文本
从目前已经发布的政府文件中的有关监管要求归纳分析当下NFT交易平台合规经营的去金融化路径。就本身的属性而言,NFT与FT的核心区别在于它的稀缺性、不可分性。从近期国内政府发布的一系列公告、通知或文件来看,数字藏品的去金融化工作则属于平台是否能存续运营的关隘所在。
作为燃料电池(FC)的关键组件,离子交换膜对于其性能有着至关重要的影响。相较于质子交换膜燃料电池(PEMFC),碱性阴离子燃料电池(AEMFCs)现已展现出诸多优势,然而其主要短板依旧存在于离子交换膜。目前,阴离子交换膜(AEM)研究与商业化生产存在的主要问题包括离子电导率较低、碱稳定性较差、合成成本过高等。当前研究人员普遍认可的提升AEMs碱稳定性的方法有选用碱稳定性较高的离子交换基团,减少膜内
随着深度神经网络在视频内容理解与分析任务上取得卓越的效果,基于深度学习的自动视频描述已经广泛的部署在现实应用中。视频自动描述的主要挑战是从大量的帧中捕获关键视觉信息,比如物体、动作和时空关系,并用语法正确的句子进行整体的描述。现有的视频描述方法大多集中于利用注意力机制,捕获全局视频中的关键帧或帧中的关键区域来对视频的语义信息进行建模,而忽略了视频本身的层次结构。视频内在的这种由粗粒度到细粒度的层次
基于语义标签图的图像生成(语义图像生成),是指根据输入的像素级别的标签(语义标签图),去生成与真实图片接近的“伪真实图”。该任务可用于图像编辑、图像渲染等场景。语义图像生成任务一般用生成对抗网络(Generative Adversarial Networks,GAN)来训练,其往往需要大量的参数和计算力。在GAN模型结构与参数量足够大的情况下,其生成图像的质量尚且可观。但是,当应用场景的硬件条件比
手语(Sign Language,SL)作为一种特殊的视觉自然语言,依靠手动特征和非手动特征等多通道信息传达语言信息。近年来,手语翻译(Sign Language Translation,SLT)作为弥合聋人和听人之间沟通鸿沟的重要应用,已引起学界的广泛关注。其中,基于神经机器翻译框架的SLT是伴随着人工智能领域发展而新兴的研究领域。我们发现基于目前的研究框架,很难通过弱监督的形式深度挖掘手语作为
析氧反应(OER)和氧还原反应(ORR)是可再生能源转换和存储技术中重要的两个电极反应,开发价格低廉、高效稳定的电催化剂是实现能源转化技术产业化的关键。从微观层面认识催化剂晶体结构、电子结构与催化活性之间的内在关联对设计高活性电催化剂具有重要意义。本文以结构可调控、价态丰富的Mn基钙钛矿氧化物为研究载体,通过元素掺杂、外加磁场等策略有效调控催化剂的电子结构和电子自旋态,结合同步辐射光源的X射线光电
迁移学习(Transfer Learning)是研究如何利用其他相关领域已有经验和知识来帮助学习目标任务的方法。大多数现有的研究都是在离线数据之上进行的。而实际应用中常常需要面对在线场景下的学习任务,在这些问题中的训练样本均按一定顺序依次到来,通常无法直接获取或需要付出高昂的代价。因此进行有效的在线迁移学习算法研究具有重要的现实意义。但是,现有的在线迁移学习方法仅简单实现了将在线学习方法引入到迁移