【摘 要】
:
近年来,随着深度学习技术的发展,2D图像的场景理解取得了重大进展。然而,由于自动驾驶、机器人和虚拟(增强)现实的应用兴起,对于3D场景理解和3D场景数据可用性的需求迅速增加。目前,基于深度学习的方法被广泛应用于处理各种3D任务,如语义分割、对象识别、全景分割和实例分割等。三维实例分割需要在没有固定标签集的情况下,基于实例对三维点进行精确的分割。3D实例分割的方法主要分为两类:基于候选区域的实例分割
论文部分内容阅读
近年来,随着深度学习技术的发展,2D图像的场景理解取得了重大进展。然而,由于自动驾驶、机器人和虚拟(增强)现实的应用兴起,对于3D场景理解和3D场景数据可用性的需求迅速增加。目前,基于深度学习的方法被广泛应用于处理各种3D任务,如语义分割、对象识别、全景分割和实例分割等。三维实例分割需要在没有固定标签集的情况下,基于实例对三维点进行精确的分割。3D实例分割的方法主要分为两类:基于候选区域的实例分割和免候选区域的实例分割。但这些方法应用到大场景的分割中还有很大的局限性。为了解决大多数三维点云实例分割方法只能在分割的小块点云上训练和测试,获取的点云特征不准确,以及预测边界框与地面真值不匹配等问题。本文研究了如何从大规模点云中学习有效的特征进行实例分割,以及在二维驱动三维物体检测中如何使获取的点云特征更加准确。主要研究内容如下:1、针对现有的三维点云实例分割方法由于采样方法的限制以及原始点云都是非结构化、无序的,大多数方法仅能在小尺度的点云上进行训练和操作的问题,提出了利用随机采样的方法对点云进行采样,同时引入了局部特征聚合模块学习局部特征,以此来获得点云中每个点的局部特征。除此之外,考虑到最大池化操作会破坏点云的完整信息结构,使得局部信息与全局信息难以交互,提出使用全局上下文特征块来获得点云的全局特征。该方法利用体积比对局部和全局边界球体的内部点的位置不敏感,所以使用位置和体积比来表示全局特征。全局上下文特征块实现局部与全局信息融合的同时,显著提高了物体实例分割的准确性。之后将获取的点云全局特征和局部特征输入到3D-Bo Net网络框架实现3D实例分割。该方法在具有挑战性的数据集Scan Net(v2)和S3DIS上的实验结果表明优于以前先进方法,在Io U阈值为0.5时,m AP达到了49.36。2、针对二维驱动三维物体检测中由于分割网络预测的边界框不准确,导致在现实场景中点云准确率下降的问题。本文提出使用3D-Bo Net网络实现物体检测。先借助图像生成二维区域建议并定位在三维点云数据中,然后通过基于3D-Bo Net的分割网络和三维包围盒评估网络,实现二维驱动三维的目标检测。为了避免在二维驱动三维目标检测过程中,提取的三维点云特征严重依赖于RGB图像,我们使用卷积注意力机制(Convolutional Block Attention Module,CBAM),帮助网络学习数据中的重要信息,做出更加准确的判断,从而让提取的点云特征更准确。实验结果表明,与以前的最新技术相比,该方法在m AP方面提高了1.8%至13.7%。
其他文献
随着云存储技术的发展以及多媒体数据的增加,云端数据检索也就成为机构学者研究的热门课题,而对语音数据进行分类是提高检索效率的有效手段。传统的机器学习方法虽然可以较为出色的完成分类任务,但是也存在例如手工设计特征成本较高,无法对复杂数据进行有效计算等问题,这些问题制约了传统机器学习的发展。语音数据包含有非常丰富的信息,在一些如军事、法院等重要场合的应用中发挥着举足轻重的作用,因此如何在云环境中保护语音
浮杯泵与传统轴向柱塞泵工作原理相似,都是利用缸体与柱塞间的相对运动改变腔体容积完成吸排油。最大的不同是传统柱塞泵为缸体固定而让柱塞沿轴向运动,浮杯泵则与之相反,柱塞固定而让浮杯沿轴向往复运动。其独特的工作原理对于减少脉动和噪声、平衡轴向力和径向力、改善低速性能和降低成本,特别是使用寿命等方面具有显著优势。它特殊的结构使柱塞与浮杯之间消除了径向力,减少了一对摩擦副。但浮杯泵至今未能产业化,其滚筒板和
随着空间技术的不断发展,航天装备中的电刷触头-导电环摩擦副材料需在多种工况条件下需满足接触电阻小、电噪声低、磨损率低和滑动摩擦力矩平稳等特性,因此对导电滑环提出高稳定、高可靠和长服役寿命的要求。为满足其中接触电阻小和电噪声低的基本要求,具有优良导电特性的贵金属金(Au)成为目前电刷触头-导电环摩擦副材料的主要选择。然而金的硬度较低,其耐机械摩擦和金属的扩散性能较弱,强烈的粘着磨损和磨粒磨损,导致金
随着俄罗斯、乌克兰局势的动荡加剧,能源安全再次进入大众视野。为改变我国长期依靠能源进口的局面,保障我国能源安全,新能源的开发利用成为重点。在中国风资源分布广、储量大,如何高效利用风资源成为重中之重。风力机是风资源高效利用的关键。由于叶尖效应所产生的叶尖涡的存在,风力机扭矩下降。叶尖小翼可以起到使风力机增功的作用,它能够控制叶片尖部螺旋状发展的叶尖涡,从而改善风力机的气动性能。为了研究不同叶尖小翼构
全固态锂硫电池以其极高的理论容量、低廉的成本以及对环境友好等特点,被视为未来最理想的电池技术之一。超离子导体Li10Ge P2S12(LGPS)因为其高达12 m S/cm的Li+电导率而成为备选的固态电解质材料。但Ge元素昂贵的价格和稀少的产量限制了LGPS的应用。Li10Sn P2S12(LSPS)因为具有和LGPS类似的化学和电化学稳定性以及更低的成本,而被视为LGPS的替代材料之一。目前对
岩心图像作为油气田勘探开发工作的研究资料,是了解油藏储层含油状况最直观的基础和重要依据。岩心识别的准确性直接影响着整个石油勘探开发的工作效率。因此开发一种高性能、高准确率的岩心图像识别方法对于提高石油勘探工作效率具有重要的研究价值,但这一实现过程面临着众多难题:岩心图像背景复杂,非岩石干扰因素较多,岩性特征较小,传统岩性识别的方法无法解决图像细粒度问题。针对上述问题,本文以目标检测网络(DSOD)
联合学习中训练数据集划分为水平分区数据和垂直分区数据两种数据分布情况,目前垂直联合学习受到了越来越多的关注。主参与用户和其他参与用户共同训练模型,同时他们在各自本地端都拥有整个训练数据集中的一部分数据。逻辑回归作为广泛使用的机器学习分类模型得到了充分的应用,在数据收集阶段,模型训练都有隐私泄露的危险。因此,研究基于联合学习模式下机器学习隐私保护机制具有非常重要的理论研究和实际应用价值,越来越多的学
随着计算机科学的发展,需要收集和处理的信息也越来越多,从而带来更多的数据存储和计算的需求,同时也有越来越多的数据被上传至云端进行计算分析。虽然云端服务器具有计算资源多,数据处理能力强,硬件成本低的优势,但它却是由不可信第三方厂商负责管理和商业运作,用户的数据和训练模型的隐私安全无法得到保证。故如何确保用户在机器学习的过程中隐私数据不被泄露的同时,还能在数据隐私性和机器学习准确性、效率三者之间取得最
私家车保有率的急速上升,不仅给各大城市造成了停车困难、交通拥堵还提高了交通事故的发生频率。为了解决上述问题,人们开发出了智能交通系统。交通流预测是智能交通系统中至关重要的一环,准确又及时的交通流预测可以为交通管理部门做出决策时提供有力的依据,也可以为私家车司机提供出行的时间估计、当前以及未来可能的拥堵路段等信息。然而,交通流的时空关联性难以分析和表达,因此如何准确地预测交通流一直以来都是一个难以解
随着市场全球化,经济全球化,生产全球化的到来,各企业间的竞争日趋激烈,传统的“刚性”生产调度,难以满足客户的个性化需求,迫切需要能够满足小批量、短周期、高质量、个性化的柔性作业生产调度(FJSP)。多目标柔性作业车间调度问题(MOFJSP)不但考虑了生产过程柔性化,还注重管理决策诉求多样化,因此,更具备研究价值。生物地理学是一门研究物种分布、迁移及灭绝的学科,Dan Simon教授受该学科的启发,