基于属性和关系的物体描述方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:y358549797
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像理解是计算机视觉领域一个基础并且重要的问题,对于一张输入图像,研究者希望计算机可以像人类一样去理解其所包含的语义内容。作为图像的核心组成部分,图像中的物体包含了最为丰富的语义信息。近年来,随着机器学习技术的快速发展,计算机可以较好地识别物体所属的类别,在一些特定的识别任务上甚至可以超过人类的识别能力。然而,物体识别仅仅试图解决物体“是什么”的问题,而想要让计算机更加全面地理解图像,就需要对图像中的物体进行更精细的描述。通常,物体描述包含两个基本内容:属性描述和关系描述。物体属性通常是一些可观测到的、具有语义的物体性质,比如颜色、形状、纹理、部件等;物体视觉关系用于描述物体之间的上下文信息,比如两个物体的相对位置、动作等。  与物体识别相比,物体描述更具挑战性,主要体现在:1)同一语义(属性、关系)可以描述不同类别的物体,因此其内部的视觉表观差异大;2)物体通常包含多个相关的描述语义,逐一标注需要耗费大量的人力,在有限的标注成本下,标注不完全现象普遍存在。围绕上述问题与挑战,本文的主要研究工作包括:  (1)提出基于乘积模型的物体属性描述框架。该框架考虑到同一属性跨类别的表观差异,利用乘积模型去显式构建物体类别相关的属性分类器;在类别不可知的情况下,该方法将物体识别和属性分类联合在一起进行学习,同时获得图像的类别和属性预测;通过引入弱监督数据,乘积模型可以进一步提高属性预测的能力,以缓解原始样本标注量小的问题;将乘积模型级联到深度特征学习框架之上,采用深度卷积网络来学习更适合属性预测的图像表示。  (2)提出不完全标注下基于辅助语义的直推式物体属性描述方法。该方法采用直推式的学习范式,将测试数据加入到模型训练当中,从而更加有效地建模数据之间的表观相似性;另一方面,该方法引入辅助语义,并利用属性预测和辅助语义的低秩约束,以更准确地推断未被标注的属性;在此基础上,该方法通过多种辅助语义的获取和迁移方式来进一步缓解不完全标注的问题。  (3)提出基于深度结构排序的物体关系描述方法。该方法针对视觉信息不足以刻画类型繁多的视觉关系之间的差异的问题,提出多线索融合网络,将视觉表观信息与位置信息和类别信息进行融合;除此之外,该方法通过结构排序损失更好地利用物体关系的共现性,缓解物体关系的不完全标注问题,进一步提升关系预测的性能。  (4)提出基于语义描述的物体检索框架。通过恰当的语义描述检索相关的物体不仅具有现实意义,而且可以在一定程度上验证物体描述的准确性。为此,本文提出基于递归神经网络的语义复合网络,显式学习语义的表示向量,并通过语义复合函数获得多个语义描述的联合表示,最后,利用该表示对相关物体进行检索。  综上所述,本文针对基于属性和关系的物体描述方法及其应用开展了广泛而深入的研究,通过建模物体类别、物体空间位置等辅助信息与语义描述之间的关系,初步解决了语义描述内部表观差异大和标注不完全的问题。除此之外,本文通过构建多个语义描述的联合表示,完成了基于语义描述的物体检索任务。
其他文献
方向关系是空间数据库中重要的空间关系之一,在地理信息系统、多媒体系统和图像数据库等领域都有着重要应用,它经常用作空间查询中的选择条件,而方向关系查询的效率一直是学
入侵检测系统作为保护计算机系统安全的重要手段其应用越来越广泛,然而随之产生的大量原始报警事件也带来了新的问题:数量巨大、误报警多、重复报警多,影响了对入侵检测系统的有
随着可视化理论和计算机图形学的飞速发展,三维地质建模和可视化成了当前国内外研究热点。地质建模可视化技术为地质工作者在3D空间中观察地质结构、分析地质特征提供了新的
网络系统已经发展到大规模、分布式的无界网络;随着网络复杂性的加剧、系统规模和速度的增长、系统之间依赖性的加强,信息系统的安全问题层出不穷。但是传统的安全技术着重于
数据计算是指采用商业集群进行分布式计算解决大规模数据的存储、分析等问题的一类计算模式。随着互联网的发展,数据规模的增长,工业界和学术界对数据计算进行了广泛而深入的研
当今,Ajax技术正在Web程序中扮演越来越重要的角色,它采用了异步调用方式,综合利用了Java Script、DOM、XML Http Request、XML等技术。由于Ajax的特性,这个技术被广泛使用。本文
软件复用是解决软件危机的一条切实可行的途径。成功的实施软件复用,需要大量而丰富的软件构件资源。目前在Internet上已有大量的构件资源,但其缺乏有效的组织和管理,这使得软件
学位
用图形化的表示方法来定义工作流,具有操作简便、理解直观等众多优点,并已成为了现代化工作流管理系统的一个必备组成部分,由于大部分都是商业软件,为了深入了解其实现原理,本文探
随着Internet技术的快速发展和软件应用需求的继续增长,面向服务的计算成为了学术界和产业界关注的热点。面向服务的计算以“软件即服务”的理念为前提,期望以服务作为基本元素
移动Ad Hoc网络是由一组无线移动节点组成的,不需要依靠现有固定通信网络基础设施的网络。该网络能够迅速展开使用,所需人工干预最少,并且是没有任何中心实体、自组织、自修复的