【摘 要】
:
场景理解是计算机视觉领域的一个重要分支,旨在使计算机拥有像人类视觉系统一样理解场景的能力,是现代智能系统实现环境感知和视觉导航的基础。场景分割提供了对场景完整的细粒度理解,是实现场景理解的关键,目前在自动驾驶、智能机器人和增强现实等领域有着广泛的应用,因此具有重要的研究和应用价值。虽然基于2D图像的经典场景分割算法已在计算机视觉中取得令人瞩目的成就,然而现阶段场景分割研究仍然存在一些不足和挑战:一
论文部分内容阅读
场景理解是计算机视觉领域的一个重要分支,旨在使计算机拥有像人类视觉系统一样理解场景的能力,是现代智能系统实现环境感知和视觉导航的基础。场景分割提供了对场景完整的细粒度理解,是实现场景理解的关键,目前在自动驾驶、智能机器人和增强现实等领域有着广泛的应用,因此具有重要的研究和应用价值。虽然基于2D图像的经典场景分割算法已在计算机视觉中取得令人瞩目的成就,然而现阶段场景分割研究仍然存在一些不足和挑战:一方面,由于2D图像数据难以获取场景的结构信息且易受自然环境和成像条件的干扰,在自然场景尤其是室外场景中具有内在的局限性。另一方面,相比于2D图像数据,3D点云数据包含更丰富的场景结构信息因而有利于实现场景分割。但由于其数据特性,使得很多针对2D图像设计的传统算法,尤其是深度学习算法,不能直接应用于3D点云数据的研究。为此,本文从多模态数据融合和3D点云特征学习两个角度开展了基于3D点云的场景分割算法研究。其一是借鉴基于2D图像数据的场景分割研究成果,建立2D图像和3D点云的融合模型以弥补单一传感器的不足,提升场景分割法的鲁棒性。其二是对3D点云分割任务中的特征编码和特征解码问题展开了深入研究,构建适用于3D点云数据的特征提取算子,通过提升点云特征的表示能力以实现高效点云语义分割。具体地,本文的主要研究工作如下:提出了一种基于融合分层条件随机场(Conditional Random Field,CRF)的道路分割模型,提高了道路分割的鲁棒性。图像的多尺度特征可以提高模型的感受野,而点云的空间结构特征能弥补像素特征表现力不足的缺点。为了有效地结合图像的多尺度特征以及点云的空间结构特征,首先利用无监督分割算法产生多个尺度的图像超像素分割,建立一个基于图像的多尺度分层条件随机场。相应地,将点云投影到图像平面,再建立一个基于点云的多尺度分层条件随机场。最后在两个分层条件随机场的底层建立像素和点云点之间的连接,形成一个融合分层模型。在KITTI道路基准上的实验表明所提出的融合模型能有效地排除道路场景中的阴影、光线等干扰。提出了一种基于空间传播和空间变换融合的道路分割网络,增强了道路表示的准确性。为了利用深度网络和多模态数据融合的优势,首先设计了一个简单有效的轻量级网络来处理无序和稀疏的点云,以获得道路区域的粗略表示。然后,采用一个等分辨率卷积块来捕获图像的低级特征,这些特征用于产生基于联合各向异性扩散的空间传播模型的热扩散系数。在学习到的低级图像特征的指导下,通过网络中的空间变换,在透视视图和俯视视图中对粗略表示进行空间传播融合。最后,将两个视图下的结果整合,生成道路区域的最终细化表示。在没有任何额外的数据增强和预训练下,所提出的方法在KITTI道路基准测试中获得了有竞争力的结果。提出了一种基于连续条件随机场卷积(CRFConv)的点云分割算法,增强了网络的定位能力,从而提高了分割性能。条件随机场通常被建模为标签空间中的离散模型,以鼓励标签一致性,这实际上是一种后处理。本文重新考虑了在点云特征空间中的CRF,因为它可以很好地捕捉特征的结构以从根本上提高特征的表示能力,而不是简单地平滑标签。首先将点云特征空间中的CRF模型的求解过程重新表述为一个消息传递图卷积,然后将其嵌入到分割网络的解码层的以恢复在编码阶段丢失的高级特征的细节。在多个点云分割数据集上的实验证明了所提出方法的有效性。提出了一种自适应混合高斯卷积(AGMMConv)的点云学习算法,提升了内核表示对局部几何结构的适应性。卷积神经网络的成功主要归功于卷积核的(平移)不变性和局部模式匹配效果。受此启发,提出用一个混合高斯模型(Gaussian Mixture Model,GMM)表示离散的卷积核,其中均值向量表示核点的位置,而协方差矩阵确定每个核分布的形状。同时,该GMM也是从局部观察中学习到的局部几何表面的分布表示,这使得内核能够适应局部几何结构。所提出的卷积本质上对排列和平移不变,此外,还可以从概率表示中引入潜在的旋转不变性。在卷积过程中,一系列共享参数权重与每个GMM内核点相关联,以匹配点云的局部模式。在目标级和场景级点云数据集上的实验证明了所提出方法的有效性和鲁棒性。
其他文献
数字教材在科学技术进步的推动下表现出更为丰富的功能属性。技术赋能让使用数字教材的课堂教学逐步呈现出教学内容可视化、课堂教学跨时空和人机交互等数字化新面貌,但数字教材的使用在给教学带来各种便捷的同时,也产生了不同程度的负效应,这是技术和教学融合不充分的结果。基于此,教师在使用数字教材进行教学时,教学内容的可视化转换应基于学生认知特点和媒介特性,帮助学生树立正确的数字教材使用观,交互性教学要守住学习独
<正>4月7日上午,西藏自治区电教馆在拉萨组织召开西藏义务教育国家课程数字教材规模化应用工作启动会。西藏自治区教育厅二级巡视员李志鹏、人民教育出版社副总编辑朱于国出席会议并讲话,西藏自治区电教馆馆长普珍主持会议。李志鹏同志在讲话中指出,党的十八大以来西藏教育事业取得了历史性成就。2022年,
以全球变暖和极端天气气候事件增多为主要特征的气候变化正持续影响着自然系统与人类社会。中国是全球气候变化的敏感区,还是世界上受气象灾害影响最严重的国家之一,气象灾害呈现出发生频率高、影响范围广、致灾性强的特点。农业是国民经济的基础,也是最易受自然气候影响的经济部门。由于气候变化所引发的气象灾害发生的频率和强度明显增强,使得中国农业生产的不稳定性加剧,农业生产面临的外生风险加大。采取积极措施应对气象灾
目的:探讨全专团队联合管理模式对围绝经期女性骨质疏松症的防治效果。方法:选取2021年1—6月于上海市奉贤区奉浦社区卫生服务中心就诊或陪诊的103名围绝经期女性作为研究对象,随机分为研究组及对照组。研究组实施全专团队联合管理模式干预,对照组实施常规社区干预。比较两组干预效果。结果:干预后,两组骨质疏松症相关知识问卷中的饮食分量表评分比较,差异无统计学意义(P>0.05);研究组危险因素、运动分量表
数字项目是数字政府建设的载体。当前,数字政府建设正向纵深推进,政府发起了包含城市大脑、政务服务平台在内的大量数字项目。政府往往缺乏项目建设所需的数字技术,通常需要与企业合作,因而项目合作伙伴选择成为影响数字政府建设绩效的关键命题。以往研究较少关注数字项目外包中的合作伙伴选择。在少数相关研究中,还未有研究分析政府数字项目类型、特征对合作伙伴选择的影响。本文致力于刻画当前政府数字项目的内涵与类型,并探
频率上转换红外成像技术是一种通过将短波红外或中红外光转换为可见光或近红外光再进行探测的间接红外成像手段,相比传统红外探测技术具有探测器噪声低、像素更小、可在常温下工作等优势。周期极化非线性晶体和准相位匹配理论的出现突破了频率上转换成像中有效非线性系数受限的瓶颈,提高了系统的转换效率,使频率上转换成像技术得以进一步发展。本文通过结合频率上转换成像技术与单像素成像原理,围绕解决基于准相位匹配的频率上转
智能车辆系统的探索与研究是人工智能和模式识别领域最受关注的热点之一。智能车辆通过多种不同类型的传感器数据对车辆周围环境进行感知,从而做出更加精确的评估和决策。相机、惯性测量单元(Inertial Measurement Unit,IMU)和激光雷达(Light Detection And Ranging,Li DAR)是最常用的三种车载传感器。相机提供具有丰富的颜色和纹理信息的图像数据,IMU通过
频率选择吸波体(Frequency Selective Rasorber,FSR)是在结合传统频率选择表面(Frequency Selective Surface,FSS)和电磁吸波体的基础上,由相同结构单元排列而成的具有通带内传输和通带外吸收特性的周期阵列结构。作为一种具有空间透波/吸波作用的电磁功能材料,FSR在天线、雷达罩、隐身技术等通信安全和军事领域中具有广泛的应用前景。随着通信和雷达系统
随着数码相机和互联网技术的普及,图像视频数据的获取变得越来越容易,以集合为单位的分类问题受到了研究者们的广泛关注。不同于传统的单幅图像识别问题,图像集数据可以提取出更加丰富的信息,有利于提升识别精度。然而,由于场景变化、视角不同、姿态多样、光照不可控等因素,每个图像集均包含了很大的变化,使得类内的差异性可能远远大于类间的差异性。同时,图像集数据位于高维空间,往往含有大量冗余特征,从而导致了高时间成
2014年,基于层状钙钛矿太阳能电池被第一次报导且展现出优良的环境稳定性,此后的短短几年间,其能量转换效率从4.73%提高至19.3%。甲脒(formamidinium:FA)基层状钙钛矿被证明比甲铵(methylammonium:MA)基层状钙钛矿具有更低的带隙和更加优良的稳定性,因此FA基层状钙钛矿可能更适合作为太阳能电池的活性层。然而,随着层状钙钛矿中无机层数(n)的增加,其形成能也随之增大