基于多视图深度学习的三维物体识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:zsjbusiniao1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维物体识别是计算机视觉中的一项基本任务。近年来,基于多视图的深度学习方案在这个任务上展示出了其有效性和优越性。在本文中,我们旨在解决现有方法中的问题,并侧重于提高模型的有效性。从一开始,基于多视图的方法大都采用视图池化层来将多个视图特征聚合为一个紧凑的描述子。但是,这些视图池化层往往使用固定的池化方案(例如,最大或平均池化操作),因此它们会存在信息丢失或信息污染的问题。为了解决这个问题,我们提出了自适应排序池化层,它可以通过自适应地调整分配给每个特征的权重,从训练数据中学习到合适的池化方案。最近,基于多视图的方法倾向于挖掘视图之间的相似性。然而,大多数现有的方法将三维对象的多视图表示视为无序集合,因而忽略了视图之间的动态关系(例如视图间的顺序语义依赖性)。为了解决此问题,我们提出将多视图表示视为一个序列,并旨在利用不同视图之间的长期依赖性进行三维物体形状识别。我们通过构建基于双向长短期记忆网络的序列感知视图聚合模块来完成这一目标。三维物体部件的对应关系为三维物体识别提供了有效的判别线索。但是,现有的基于多视图的深度学习方法都未能显式地利用这类对应关系。此外,现有方法忽略了多视图图像的视角信息,而这些视角信息实际上蕴含了丰富的三维关系信息。在本文中,我们提出了一个即插即用的模块,称为三维感知的对应性学习模块(3ACL模块)。该模块通过显式地考虑视图的视角关系来对视图内/视图间的局部对应关系进行编码。并且3ACL模块可以很容易地被插入到任何现代卷积神经网络中并进行联合训练。为了对我们提出的方法进行评估,我们在三个被广泛使用的数据集上进行了详尽的实验。实验表明我们的方法在三维物体分类和检索任务上取得了业界前沿的结果,验证了我们方法的有效性。
其他文献
"殖产兴业"政策是日本明治政府发展资本主义工商业的指导方针,具体内容是:借助国家政权的力量,导入市场经济;以各种政策为杠杆,加速资本原始积累的过程;动用国库资金,创办官
【正】 经济效益是指经济活动中劳动占用和劳动消耗同劳动成果的比较,以及这种成果给整个社会、集体和个人所带来的实际经济利益。进行商业活动,要占用一定的人力、物力和财
清代文人沈复在他的《浮生六记》中写道:“剪栽盆树……缀以盆中花石,小景可以入画,大景可以入神……”到了现代,大多数人已经没有了那时的闲情,然而对植物的喜爱是一样的,不过讲究
介绍红河供电局针对GW16(17)型隔离开关的运行情况及存在的问题.进行技术改造的情况.
【正】 租赁服务,这本来是一举数得的好事,可是这些年来,“租赁”这个词却很少被人提及,似乎“租赁”与社会主义制度是不相容,有些人甚至把“租赁”与经济剥削、资本主义等量
很长时间以来,国内大张旗鼓地肯定出口创汇的成绩,强调'顺差额'的大幅增长.诚然,在改革开放之初,鼓励创汇战略确实给国家带来了巨大的利益,也符合当时的国情.然而,正
农业、农村、农民问题说到底是农民利益问题,农民利益最基本的是经济利益.近几年来,农民收入增长缓慢,农民收入增长问题成为政府和社会高度关注的问题.农村基层组织作为农村
论述了云南省电力资源优势、广阔的电力市场前景和"西部大开发"的机遇,电力工业发展成为云南第一大支柱产业和在2020年把云南省建成中国第一电源基地的可行性.
虽然德国边境安全治理高度依赖欧盟的整体治理,但德国本国的边境安全治理颇有特点,有借鉴启示的研究价值。在分析德国边境安全治理框架基础上,梳理德国政府应对欧洲难民危机
湿婆是印度教神殿中的重要神  ,对于他的赞美 ,亦遍见于印度教各典籍。赞美方式之一 ,即称颂名号。印度教在其发展过程中 ,曾将千余名号奉献给湿婆。本文首先就湿婆神的传说