基于多视角的三维物体识别算法研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:MyFairy83
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维物体识别是物体识别领域重要的研究方向之一,尤其是近年来,三维物体识别在机器人抓取、探测、自动驾驶,装配任务及医学图像分析等等领域发挥者重大的作用。而基于多视角的三维物体检测算法是三维物检测的流行趋势,其与基于形状的检测方法对比,优点是不依赖复杂的3D特征、数据量大、有成熟的高级网络框架,简单而高效。与单视角图像的识别相比,多视角图像可以互相补充物体细节特征,这样即使在有遮挡、明暗变化的情况下,三维物体仍能被准确识别。本文从基于多视角的卷积神经网络出发,研究对比了在该模型下使用不同视角选择方案对检测结果的影响,同时对该模型下多视角特征融合方式进行反思,创新性的提出了一种基于视角加权式的池化方式,为后续分类网络提供更丰富的视角特征。更进一步,鉴于多视角数据采集过程有一定的规律性和时序性,本文在卷积神经网络的基础上引入了循环神经网络单元,利用循环神经网络对历史信息的记忆特性对历史视角特征进行融合,同时在该网络中设计了三种不同的注意力模块,让每个视角在空间维度和通道维度上提取更多有用的细节信息。最后,为了能让模型具有主动选择下一最佳视角的能力,本文引入了强化学习模块,采用带有基准线的REINFORCE策略梯度方法,结合随机梯度下降算法进行联合训练。且为了解决视角选择的“边界效应”以及子网络训练不平衡问题,本文提出了一种分类置信度引导式的策略梯度流增强方法。同时在损失函数中加入具有视角位置限制的正则化项,避免选择视角之间相互重叠,保证选择的视角更分散地环绕在三维物体周围,从而学习到更为全局的物体特征。
其他文献
介绍10kV系统中性点不同的接地方式,对10kV系统中性点接地方式的发展及应用进行了分析。
为充分利用TiO2纳米粒子有效降解空气中的甲醛,将TiO2纳米颗粒(P25)分散于SiO2溶胶中,利用提拉的方法将其附着在金属丝网上降解甲醛,讨论TiO2与SiO2溶胶的比例、提拉次数、干
企业并购作为现代经济生活中一个极其重要的现象,是市场经济高度发展的产物,是企业对市场竞争的一种反应.纵观资本主义的经济发展史,经济发达国家已经历了以大公司横向兼并为
在指纹检测识别过程中,常常由于指纹污损或者角度偏移,导致指纹无法被准确快速的识别出来。为解决上述问题,提出了关于指纹三角区域的深度残差网络检测方法。方法首先将指纹图像采取预处理,包括数据压缩、均值削减、白化操作等步骤,旨在降低干扰与虚假特征,便于三角区域及其特征的检测;然后引入深度残差网络,用于提取抽象度较高的指纹三角区域及其特征;最后针对深度残差网络,设计了非线性残差计算与代价函数,并利用改进的
对高压加热器泄漏的危害及其原因进行探讨,提出了防止高压加热器泄漏的对策。
一、当前农民增收与贫困群体发展现状我国有7亿多农民,以人均年收入625元为贫困线划分,截至去年底,贫困农村人口约为2900万.与去年全国农民人均纯收入2622元相比,这个标准是
稻飞虱是水稻上最主要的虫害之一,其危害发生面积和范围逐渐扩大。本文作者综述了稻飞虱的生物型分类,抗飞虱种质资源评价、筛选、基因定位、应用等方面的进展,发现近10年在
介绍某电厂烟气旁路封堵后脱硫设施及机组的运行情况,分析取消或封堵FGD旁路烟道后的风险提出保证脱硫系统正常运行所采取的措施。
强化电力生产技术监督工作的有效性、实时性,将直接响电力行业发供电的安全性及经济效益,对水厂主机设备,调速系统性能检测列为电厂定检项目和在水厂在线监测系统的基本性能
介绍300MW火电机组燃用小龙潭褐煤的锅炉炉型选择的依据,分析比较循环流化床锅炉与常规煤粉锅炉加烟气脱硫的运行成本.