基于多模式特征学习的RGB-D目标识别算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:Vilmar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于在机器视觉领域中常见的交互式机器人,能在复杂环境中识别对象和实例是非常基础且必要的功能,因此对目标识别算法的识别性能进行研究意义重大。基于RGB-D数据的目标识别算法将RGB数据和深度数据作为多模式数据进行特征学习,能有效弥补传统单模态数据的缺点,在近年来得到了迅速的发展,并被广泛应用于机器人和航空飞行领域。目前该算法面临着深度数据质量不高和不同模式的特征学习问题等挑战,针对以上挑战,本文提出了基于多模式特征学习的RGB-D目标识别算法。为了在多模式特征学习中更好的拟合RGB数据的分布,需要首先对深度图进行着色,本文首先利用聚类和滤波的方法对深度图进行了填充和预处理,再利用卷积神经网络的特性,提出了基于生成对抗网络的深度图着色方法,生成对抗网络的判别器由残差网络构成,判别器通过不断降低真实RGB图像和着色后的深度图之间的差距来实现对深度图的着色。对深度图着色的目的是为了更好的进行多模式特征学习,本文在传统的多模式特征学习框架下,应用矩阵变换理论和子空间学习的方法,设计了基于多模式特征学习的RGB-D目标识别算法,对两模式数据之间的共有特征和特有特征进行了学习。同时,为了避免丢失低维特征包含的有效信息,对每一层特征都进行了提取,提高了识别准确性。最后使用正则化项和损失函数构建目标函数,并利用梯度下降法对目标函数进行了优化。最终,本文设计了合理的实验验证算法的优越性,在经典的Washington RGBD数据集和JHUIT-50数据集上去评估算法的性能。实验部分将本方法与目标识别领域主流的RGB-D目标识别算法进行了对比实验,实验结果表明本文提出的基于多模式特征学习的RGB-D目标识别算法可以表现出较好的识别性能,此外本文还对算法进行了消融研究,以探讨多尺度特征提取和多模式特征学习框架对算法识别性的影响程度。本文提出的算法无论在理论创新还是在实际应用中都有着非常大的价值和意义。
其他文献
数据规模的快速增长使传统数据库在伸缩性、易用性以及快速响应等方面的限制开始凸显,为了应对复杂的业务变化,数据库的架构不断地复杂化,导致数据库的维护成本激增,云数据库服务的出现就是用于解决这个问题。云数据库服务的主要作用是向用户提供托管的数据库实例,可以做到实例的快速部署和免维护,还会提供诸如高可用、可伸缩和灾难恢复等特性。目前已有的云数据库服务大多面向公有云,面向私有云的云数据库服务相关的研究较少
随着大数据技术的迅猛发展以及数据规模的持续增长,为了能够有效地在不同行业或者不同组织之间实现知识共享,需要在保证知识流通的同时,通过联合处理计算,进一步分析、挖掘数据资源的内在价值。但是,由于数据规模大、开放性强、用户数量不断变化的特点,知识共享过程中往往面临着巨大的信息安全和隐私保护问题。传统的访问控制技术在保障数据资源访问的过程当中,仍然存在着需要可信第三方,身份验证效率偏低以及安全性差的问题
多功能雷达组成的网络系统,相对于传统单站多功能雷达,在反隐身、反辐射导弹、抗干扰、目标定位等方面有明显优势。组网雷达系统中资源有限,且要充分提升系统的探测、干扰等性能指标,需要合理分配、调度有限的系统资源。本文主要针对多功能组网雷达系统中实体资源雷达站点的位置,提出了静态场景下的资源调度模型,并在此基础上建立了动态场景下的资源调度模型。将粒子群优化(Particle Swarm Opimizati
近年来在线教育受到的关注度越来越高,但是目前的在线教育基本上还是以辅导老师为核心,在科技方面更多的是还是体现在教育平台的竞争发展上。因此人工智能与教育相结合的自动推理解题系统有着很大的发展与应用前景,而且对社会的发展大有裨益。数学作为教育中的一门重要学科,对逻辑推理的要求很高,而且对于人工智能来说数学也是其发展的根基,两者是相辅相成的。本课题参与的初等数学解题系统以数学作为突破点,力求能做到对初等
在生殖医学领域中,对人工授精产生的胚胎发育状况的分析,主要基于时差摄影设备采集到的图像。而胚胎发育需要经历几个时期,每个时期特征发育程度的好坏对最后胚胎的移植都有重要影响,目前主要依靠医生从大量的胚胎发育图像中进行肉眼观察和纸质化记录,十分耗费医生的人力资源,并且存在观测不及时和遗漏等问题。因此,亟需一种自动化的特征识别软件,来减轻医生的负担。本文主要识别的胚胎发育特征为卵裂球的数目、卵裂期碎片比
精神分裂症是一种复杂性的精神类疾病,多发病于青壮年,以行为、情感、思维等方面紊乱以及心理活动不协调、不连贯为显著特点。因为其复杂性,精神分裂症的发病机制、治疗及预防一直都是精神病学研究的中心课题。静息态功能磁共振成像(resting-state functional magnetic resonance imaging,rs-f MRI)是探究精神分裂症病理学的有效手段。精神分裂症患者存在广泛的大
血管信息的实时监测对心脑血管疾病的诊断,以及对治疗方案的规划评估有着重要的意义。目前,超声成像基于其低成本、实时性以及无电离辐射等优势成为了临床医学诊断中一种广泛应用的成像方式,而血管检测正是超声成像技术中一个常见的应用点。传统超声成像设备中通常都包含了B模式成像,彩色多普勒成像以及脉冲多普勒成像等成像技术,可用于检测体内血管的分布、血管的走向以及血流速度等血管信息。二维B模式超声图像能够对扫描组
随着通信网络的不断演进,多输入多输出(Multiple Input Multiple Output,MIMO)技术与正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术成为了第五代移动通信网络(5th Generation,5G)上下行链路的基本传输机制,并起着关键支撑作用。MIMO-OFDM技术不仅具有很高的频谱利用率和传输速率,并且
在数据大爆炸的时代,以及5G技术和存储技术的发展,在线音乐播放成了当今用户听歌的首选,但是面对海量的音乐数据,用户们往往显得无从选择,听歌作为日常的娱乐放松方式,一首首的试听明显不太现实。在面对巨大的音乐数据,以往的音乐推荐系统虽然能进行一定程度的筛选,但是过滤后的数据量仍然非常之多,这样的推荐系统已经满足不了用户的需要,不能根据使用者的爱好来进行歌曲推荐,造成推荐不精准的问题,不能给用户带来良好
随着移动通信技术的发展,越来越多的信息通过无线的方式进行传输。由于无线空口开放的特点,信息安全面临着极大的挑战。低截获概率通信能够从物理层防止信号被截获,从而保障信息安全,是当下研究热点。低截获概率通信主要包括信息低截获和信号低检测两个方面。本文侧重于信号低检测,也称为隐蔽通信,它旨在确保以任意小的概率被监听方检测的基础上,实现通信方信息的可靠传输。与其他安全通信手段相比,隐蔽通信从根本上解决了信