注意力机制在点云和图像融合目标检测中的研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:gaoyueeryubing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,单一传感器在感知任务中存在局限性,为了提高感知任务的准确性,许多工作采用了多传感器融合方法。在三维场景感知技术迅速发展的背景下,多模态融合在三维目标检测中已广泛应用。然而,当前的多传感器融合方法存在以下问题:对于多传感器信息的利用效率较低,难以有效解决复杂场景下成像分辨率低以及部分物体被遮挡的检测问题。此外,多模态融合需要考虑多个传感器的数据,算法鲁棒性差,容易受到传感器故障、数据缺失等因素影响。因此,当前的多传感器融合方法仍需要进一步改进,以提高感知任务的准确性和鲁棒性。在深度学习技术中,注意力机制通过实现对不同特征的自适应选择和加权提升深度网络表征、分析和理解数据的能力。针对多模态融合中存在的问题,本文主要研究在点云和图像信息融合的目标检测任务中,注意力机制对检测结果的影响,并验证了本文算法的有效性。具体的工作内容如下:1)基于注意力机制的单模态检测算法研究。该部分,研究单模态数据实现目标检测任务。实验采用编码-解码结构,在编码器和解码器之间插入局部-全局注意力机制模块,以获取更丰富的全局上下文信息。局部-全局注意力机制模块由局部模块、全局注意力机制模块及跳跃连接结构组成。实验结果表明,本文提出的检测算法在图像和点云单模态下都能有效地提升检测效果。2)基于注意力机制的多模态检测算法研究。该部分,研究采用包含多种传感器数据的Nu Scense数据集。在基于第一部分的研究基础上,实验首先采用初始化目标查询机制,将提取的图像特征作为引导信息得到Query;接着在编码-解码结构中添加交叉注意力机制融合图像特征和点云特征;最后通过两个解码器层分别预测候选框和输出目标检测结果。其中,交叉注意力机制模块分别将点云特征和图像特征的Query交叉计算得到融合特征。检测头中的每个解码器层之后添加前馈神经网络和监督,利用预测候选框限制交叉注意力。交叉注意力机制可以对不同传感器特征图之间进行建模,能够充分利用特征图中的语义信息。实验结果表明,相同场景下,多模态比单模态的目标检测指标m AP提升了4.1%;不同场景下,本文的多模态融合方法的网络检测性能更加稳定。
其他文献
商业银行是经营货币的企业,按照业务类型可以分为对公业务和个人业务。对公业务主要服务对象为公司或单位,个人业务服务对象为个人。对公业务历来是银行业务发展的基石,也是银行收入的主要来源。但近年来,我国银行业在监管持续趋严、金融脱媒的背景下,传统业务市场被挤占、优质对公客户流失等问题日益凸显。同时,受全球经济低迷和新冠疫情影响,银行为实体经济减负、减费让利、资金成本上行等政策压力使得对公收益不断收窄,就
学位
近几年,我国交通业发展迅速,交通发展水平不断提高,基础设施建设运营成绩显著。数据显示,我国已有约25万个路口、400万公里路段,公路基础建设极大方便了人们的出行生活,也增强了道路运输服务能力,促进了社会经济发展。但随着城市规模不断扩大,城市人口和车辆数量急剧增长,交通拥堵系数不断升高。同时,各类交通违章、交通事故频发,尤其在城市干道交叉口、人车混行路段情况更为严重,进一步加剧了城市道路的拥堵,降低
学位
本文就文艺战线展现文化自信、以历史主动的精神投身社会主义文化强国建设的路径进行了梳理和归纳,认为各级文艺组织和广大文艺工作者要从三个方面做起。一是以理论清醒保持政治坚定,强化文化自信捍卫“两个确立”的主动自觉。二是以价值引领提升文化自觉,激发文化自信砥砺文艺理想的责任担当。三是以时代主题统领工作课题,彰显文化自信赋能高质量发展的独特作用:坚持以文化人,在助力乡村振兴中展现新作为;坚持以文塑旅,在推
期刊
<正>近年来,诸多弘扬中华文化的优质文艺作品次第涌现,《唐宫夜宴》《长安十二时辰》《风起洛阳》等蕴含了浪漫悠久的东方美学品格,《觉醒年代》《山海情》《功勋》等塑造了生动饱满的英雄形象……这些彰显了文化自信的影视艺术作品,有效助力了中国之美的传播。近期,动画电影《雄狮少年》中“宽眼距、吊梢眼”的主角造型引发争议,与此相类似的,某产品广告中的“眯眯眼”造型以及部分摄影作品中模特造型等,均被置于广泛讨论
期刊
环境感知技术是支撑智能汽车发展的重要基础。感知模块的作用是得到周围目标物的详细信息,包括类别、距离等。常用传感器中,摄像头擅长检测目标类别,激光雷达便于检测3D位置,但检测类别信息不够丰富,将二者融合可实现优势互补。感知模块得到的目标物信息是决策和规划模块的输入,因此感知算法需要准且快。目前融合感知算法常存在实时性差、难于在嵌入式设备上部署等缺点,全面提高融合感知的实时性和准确性是一个值得研究的课
学位
三维目标检测技术是数字图像处理领域的关键问题,在军事、工业等领域有着广阔的应用前景。深度学习是一个复杂的机器学习算法,通过对样本数据的内在规律进行学习,获取样本的深层次特征,进而更好的完成对样本的解释。近几年来,得益于基于点云和双目视觉的三维检测算法的发展,三维目标检测结果的精度得到显著的提高。然而,点云需要昂贵的激光雷达设备获取,双目成像设备的架设场景要求较高,且在工业应用方面,成本较高。因此,
学位
高考标准的制订,使得高中生物课堂教学模式和课堂教学手段的优化和创新就显得尤为重要。对高中生物学科知识而言,学科知识关联度较大,生物知识的“归纳总结”和“串联学习”具有重要意义。项目驱动能够让学生在生物学习过程将教师的知识教学和技能教学作为学习项目,并在项目驱动之下进行“归纳总结”“融会贯通”“高效学习”,构建高中生物知识体系,强化自己对生物知识、生物理论、生物概念的认知。
期刊
三维目标检测与跟踪作为自动驾驶感知模块中的核心任务需要在识别物体类别的同时检测出物体在三维空间中的位置、大小、朝向和速度并输出物体历史轨迹,从而为下层的预测和决策模块提供依据。激光雷达和相机作为智能汽车感知系统中两种常见的传感器可以为三维感知任务提供不同的模态支持。激光雷达生成的点云可以提供准确的深度和几何信息,但是点云具有稀疏性且只能提供形状信息,在面对远小或形状缺失的物体时,描述能力不足。相机
学位
制造业对建设社会主义现代化强国、发展壮大实体经济具有十分重要的战略意义,但同时我国制造业存在着大而不强、全而不优、关键核心技术受制于人等现象。近年来,我国数字经济蓬勃发展,已经取得巨大成就,对提升制造业高质量发展水平具有一定的影响作用。因此,本文研究中国地区制造业高质量发展水平测度及数字经济对制造业高质量发展的影响作用,将对建设制造强国、增强国家综合实力有一定的现实意义。本文首先利用2011-20
学位
智能汽车环境感知系统通过各类车载传感器获取本车周围道路信息,为后续车辆决策提供参考依据。目前主流的毫米波雷达与视觉传感器融合方法中,基于深度学习视觉检测算法模型较复杂且参数量多,影响目标检测实时性;毫米波雷达无法提供高度信息,在复杂拥堵场景下易发生误检漏检情况。本文提出一种决策级信息融合算法,分别使用毫米波雷达和单目相机对车辆检测跟踪,从视觉传感器检测跟踪、雷达目标筛选跟踪、传感器信息融合策略三个
学位