基于神经网络的物体检测和位姿估计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xxxhht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机技术的热潮席卷全球,计算机视觉相关的技术迅速发展并日渐成熟,物体检测一直是计算机视觉领域最热门的研究方向之一。位姿估计是指估算目标物体相对于摄像机的位置姿态,在3D物体识别和检测中尤为重要,本文中利用卷积神经网络,同时处理计算机视觉的物体检测和位姿估计两大任务。本文的主要研究内容包括:1、研究了传统的物体检测算法,分析了它们的优缺点。传统的物体检测算法MVCNN需要使用目标物体所有视角的图像,才能完成物体分类。但是实际场景中从所有预定义视点获得物体所有视角的图像不现实。因此,本文采用旋转网络方法,该方法在物体分类过程中,只需要物体部分视角的图像,并将物体多视角图像的视角标签作为隐变量,通过对目标物体部分视角图像的不断旋转迭代,不仅可以实现物体分类,还可以估计物体姿态。旋转网络的基础卷积神经网络为AlexNet,在AlexNet网络的基础上,提出了两种将网络不同深度的层输出的特征图进行结合的策略,第一种策略为将特征图在深度方向进行叠加,第二种策略为将维度相同的特征图对应位置元素进行融合。2、本文在Faster R-CNN的基础上,将位姿估计的分支以不同的形式加入到Faster R-CNN的网络结构中,扩展Faster R-CNN的网络结构,得到三种物体检测和姿态估计的网络模型,即单路径结构、双路径结构和双网络结构。三种结构的网络模型不断解耦物体检测和姿态估计任务。对于姿态估计任务,目前存在两大流派的处理方法,第一种是将位姿估计问题作为离散的分类问题,第二种是将其作为连续的回归问题。本文中对这两个流派中的典型的损失函数分别进行了研究。3、实验部分主要针对传统的检测方法与本文中的两种物体检测和位姿估计方法进行实验与分析。对于基于位姿隐变量的物体检测和位姿估计方法,分别在ModelNet10、ModelNet40与RGB-D三个开源数据集上,对基础AlexNet、深度叠加网络和特征融合网络的分类与位姿估计精度进行测试。对于基于Faster R-CNN的物体检测和位姿估计方法,在Pascal 3D+数据集上,分别对单路径结构、双路径结构和双网络结构进行测试,统计其检测精度。对位姿估计的离散损失函数和连续损失函数进行了实验测试。最后将检测表现最好的双网络结构模型与现有的联合检测方法进行对比,证明了本文中算法具有不错的研究前景。
其他文献
目的 :研究中国道家认知疗法对神经质倾向人格的大学生的心理保健作用。方法 :63名大学生 (EPQ量表 ,N量表粗分≥ 17分 )随机分为干预组 ( 3 2名 )、对照组 ( 3 1名 ) ,随机
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种高分辨微波成像雷达,因具有全天候,全天时的特点,已成为获取目标地物信息的重要手段之一。随着SAR技术的不断发展,雷达获
社区矫正是与监禁矫正相对的行刑方式,其在我国试点实施已近5年,但实施过程中的某些问题严重制约着社区矫正制度的发展。目前,构建我国社区矫正制度发展的长效机制必须要解决
<正>名医扁鹊周游列国,途经齐国。当时齐国的国君齐桓公知道扁鹊是天下少有的名医,便把他当作贵宾来接待,并择日召见。当扁鹊第一次看到齐桓公的时候,发现他的神色不是很好,
绿色营销作为一种新的营销理念,成为21世纪营销的主流,为经济的可持续性发展开辟了新的途径。在我国,实施绿色营销活动受很多因素的影响,既有内部因素的制约,又受到政府,消费
通过对现阶段幼儿园社会领域课程的现状调查分析,我们发现社会领域课程现状中存在着教育发展不均衡、教学目标把握不清晰、课程教学内容不适宜及教育方法不恰当等问题。通过
目的:探讨中国道家认知疗法对焦虑障碍的疗效。方法:将143名焦虑障碍患者随机分为三组,第一组使用道家认知疗法、第二组使用药物治疗、第三组使用道家认知疗法合并药物治疗,
依据民用船舶设计工作特点,分析了民用船舶设计流程,以及在设计工作全过程中设计质量控制环节,以期对船舶设计质量实行有效控制.可供船舶设计院所、船厂设计部门参考.
目的:比较牙颌面专用CBCT与曲面体层对颌骨牙骨质瘤的诊断价值。方法:对3例发生于上下颌骨中的牙骨质瘤患者,分别选用曲面体层和CBCT检查,并将检查结果进行比较分析,判断相互之间
高效液相色谱(HPLC)法是药物分析领域中应用最广泛的一种色谱模式,其中色谱柱是其核心的部件,是实现色谱分离、分析的关键,因此色谱柱的研究对药物分析的发展具有重要意义。有机