基于深度学习的三维目标识别算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:wsx19781029
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Kinect、RealSense等新型三维智能传感技术的出现,使得记录高质量的RGB图像和深度(Depth)图像变得十分便捷,而基于RGB-D图像的三维目标识别研究也得到广泛关注。已有研究表明,RGB和深度图像信息的结合可以显著提高三维目标识别的准确率。特征提取是三维目标识别研究的重要部分,而深度学习算法在自主学习和特征抽象方面表现突出,已经成为计算机视觉领域的重要研究方向。因此,本文针对三维目标识别任务,结合RGB图像和深度图像信息,提出基于有监督深度学习和无监督深度学习的RGB-D目标识别算法。首先,本文提出一种基于监督学习策略的多模态深度卷积神经网络(DCNN)改进算法。该改进算法通过采用PCA估计曲面法线来实现对Depth模态图像的彩色化编码,并使用CaffeNet模型[50]作为预训练参数,经过参数微调实现模型训练和特征融合。然后,提出一种基于非监督学习策略的特征学习算法—CNN-SPPL-RNN。该算法针对CNN-RNN模型[41]中对不同尺寸的输入图像的泛化问题,引入空间金字塔池化层(SPPL),并借助SPPL从不同的空间尺度提取平移不变性特征,再通过随机RNN网络层组合成高级特征。最后,在采用本文的CNN-SPPL-RNN算法提取特征的基础上,提出一种树形结构的姿态估计算法框架。本文采用Softmax分类器,在RGB-D数据集上进行算法性能验证,结果表明改进的多模态DCNN算法类别识别准确率小幅提升,实例识别准确率高达96.9%,较HMP算法[38]提升了4.1%;基于非监督深度学习的CNN-SPPL-RNN算法在使用较少特征的情况下,能达到目前最高的类别识别准确率;同时,提出的姿态估计算法能有效地实现姿态定位。
其他文献
传统意义的市场实际是"卖方的意思表示为主的市场”,市场经济发展到现在已经孕育了建立为买方服务为主的市场模式的客观要求,经济科技的发展已经为"买方的市场”创造了条件,"
幼儿营养不良,有时可以从他们的行为中反映出来,如烦躁、嗜睡、搔痒、头发稀疏干黄、食欲减退、口腔黏膜反复溃烂以及喜欢吃泥土、煤灰等,幼儿的这些表现往往是缺乏某种营养素的
现代港口不仅是运输服务的枢纽,也是产业聚集、素汇聚的地。"十二五"以来,长江港口规模化、产业化、信息化、现代化建设方面取得了长足的进步。但与构建长江立体交通走廊、推动
为加快建立航运企业评价制度,引导航运企业绿色发展,在分析我国绿色内河航运企业应具备的基本特征和要求的基础上,采用层次分析法构建绿色内河航运企业评价指标体系,根据德尔菲法
目的研究髓母细胞瘤的临床特点、显微外科手术治疗的方法和临床疗效。方法回顾性分析经显微手术治疗的115例髓母细胞瘤患者的临床资料,包括肿瘤部位、肿瘤切除率、放疗、化疗
唐代舞蹈诗中的舞姬包括后宫善舞的妃嫔、士人家中的舞女姬妾以及从事歌舞表演的宫妓、营妓与市井乐妓。大多数舞蹈诗描写的舞姬,或是风情万种的尤物,或是地位卑贱的玩物,或
2014年,发达经济体经济运行分化加剧,发展中经济体经济增长放缓,世界经济复苏依旧艰难曲折。我国经济继续保持稳定增长,实现GDP增长率7.4%的较高水平,外贸进出口总额增长2.3%
近年来,随着我国信息化技术的迅猛发展和互联网的不断普及,互联网与传统行业的融合已经成各行业的必然选择。2015年至2016年间,全国各级税务部门陆续完成了金税三期推广上线