基于多层卷积特征高阶融合的多任务目标检测系统研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lwl13751412186
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术在计算机视觉领域取得的广泛成功,当前基于卷积神经网络(CNN)的目标检测技术发展迅速。作为计算机视觉领域的研究热点之一,目标检测在视频监控、工业机器人自动化抓取等方向中拥有广泛的应用前景。在自动化抓取应用中,实际场景通常包含大量的小目标物体,同时机器人抓取需要具备准确的目标姿态估计。现有基于CNN的目标检测算法通常针对大目标物体设计,对小目标的定位能力不足,同时无法估计目标的姿态变化。针对上述问题,本文从机器人抓取的实际应用出发,分别引入二阶的多层深度特征融合结构提升小目标的检测性能,以及在CNN架构中加入角度预测层,通过多任务学习的方法同时提升目标定位和姿态估计的准确性。针对小目标检测问题,本文首先基于Hyper-Column特征融合算法,将图像分类中常用的二阶特征引入到目标检测框架中,并实现了两种包含位置信息的二阶特征融合方案:一种是基于特征非线性变换的二阶响应变换模型(SORT),一种是基于特征核方法的二阶核融合的模型(HIHCA)。VOC数据集上的实验结果表明,两种基于Hyper-Column的二阶特征融合方法均可以有效提升系统的性能;为了进一步利用底层CNN特征更好的定位能力,我们将最新的特征分层表征TDM模型和二阶信息相结合,提出了基于二阶TDM特征融合的目标检测模型。在VOC数据集上的结果验证了本文提出模型的有效性。针对目标的姿态估计问题,我们通过引入角度预测层,将刚性物体的姿态估计子任务加入到目标检测中,通过多任务学习的方式实现端对端的模型训练。在PASCAL 3D数据集上的实验结果表明,本文提出的多任务学习策略可以有效提升姿态估计和目标检测的性能。最后,本文将提出的两种模型组成一个完整的目标检测系统,并通过机器人目标抓取应用验证算法在实际场景中的性能。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
中西文化交流源远流长。但一般而言,史学界在讨论中西方关系时,大都将注意力集中在宗教及政治经济范畴,顶多由此延伸至科技、美术、建筑等显性领域,对于相对隐形的文学则极少
随着科学技术的发展,手机的功能也在逐渐增多,人们对手机的要求也越来越挑剔,然而现在大部分手机功能都大同小异,这就要求软件开发者从手机界面观赏性的角度去进行研究与开发
<正> 生存装备特种兵的生存装备包括掩体、睡袋、服装、人体铠甲和食品等。这些东西均装在一种软背包里,由直升机、小船和车辆运送。当然,船只和车辆本身也是特种部队的生存
在当前我国市场经济的环境下,对于中小企业进行财务管理制度的研究越来越重要,我国社会经济的发展需要企业进行财务管理制度的创新。在我国传统的企业财务管理过程中,出现轻
[目的]探讨影响软骨肉瘤术后复发的相关因素。[方法]回顾性分析经手术治疗并经病理检查确诊的65例软骨肉瘤患者的临床资料。[结果]软骨肉瘤患者的年龄、性别、民族、手术方式
文章对近年来3S技术在政府绩效审计中应用的文献进行回顾并评述,结合政府绩效审计实务操作中面临的问题,探讨了3S技术应用于政府绩效审计的作用机理与可行性,并以当前审计实