基于类结构学习和大规模图像分类的联合层次化学习研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:javaname39
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是计算机视觉领域中的一个基本任务,该研究方向一直非常活跃。图像分类的性能严重影响着图像分割,目标检测与跟踪等其他计算机视觉任务,因此,图像分类研究具有重要的研究意义和实用价值。  近年来,随着互联网的发展及摄像设备的普及,图像数量呈爆炸式增长,不仅如此,图像的类别数也大幅增长。尽管图像分类研究已经取得了长足的进展,然而,现有的大多数分类方法采用平铺式的方法,即采用一对多或者一对一的分类方式。该分类方式有三大缺陷:1)无法克服分类器形成过程中类别数据的不平衡,导致分类性能下降;2)类别数很大时,标号判别过程计算复杂度高;3)忽视了类别之间的结构信息,不利于数据的可视化。为此,本文针对大规模图像的类别层次结构,以及基于层次结构的分类方法进行研究。本文的主要贡献如下:  1)设计一种快速计算类间的相似性度量的方法,基于该方法,利用分层谱聚类构建视觉树,形成图像类别之间的结构关系图。  2)基于视觉树,设计了一种基于最优路径的标号预测方法。当前流行的基于视觉树的标号预测方法,往往采用贪婪学习的方式。该方法无法克服由于预测过程中高层标号预测错误带来的误差传播。为此,本文设计了一种近似最优的N-best路径的预测方法,即每层保留N条最优路径,有效克服了误差的传播。  3)将所提方法结合多种特征进行比较研究,对传统的SIFT特征、VLAD特征及当前最新卷积神经网络特征(AlexNet及Inception-v3特征)进行比较。在大规模图像数据库ILSVRC2010及Caltech256上进行实验验证。实验结果验证了所提方法的有效性。
其他文献
自组织链表是针对搜索问题提出的,它能够在响应未知访问请求序列的过程中不断调整节点位置,使链表结构逐渐进入一个能充分利用访问请求序列特性的状态,从而降低总体访问代价,
无线传感器网络是在微电子、无线通信和嵌入式系统等技术的快速进步中发展起来的一种新型网络。它能够实时监测、感知、采集和处理各种监测对象的信息,具有十分广阔的应用前
煤岩突出是煤矿生产中的重大灾害之一,它是指煤、岩石以及瓦斯中的能量突然释放或爆发性的喷出,即煤、岩石以及瓦斯在极短的时间内向巷道或工作面大量涌出的过程,通常也称为
GBDT(Gradient Boosting Decision Tree)是一个应用广泛、效果好的监督式机器学习模型。它于2001年由Friedman提出,由决策树(Decision Tree)和梯度提升(Gradient Boosting)组
信息时代的迅速发展,使得越来越多的信息被共享。自由访问型微数据发布是当前科学研究和信息交换的有效手段,也为数据共享提供了平台。但是,随着数据挖掘技术的应用及搜索引擎功
随着数字信息科学的发展,科学数据在科研活动中的作用日益提升。它不仅是经济发展、国家安全的重要战略资源,而且是政府决策和科学决策的重要依据;作为信息时代最活跃,最基本
马尔可夫随机场因结合局部信息与空间信息的特性,被广泛应用于机器视觉与图像处理相关领域中。然而马尔可夫随机场被证明是NP问题。随着MRF与Gibbs分布等价性的提出,使得计算
车牌识别系统是基于数字图像处理与字符识别技术的一种智能化交通管理系统,它主要应用于汽车的电子计费领域,例如高速公路自动收费系统、停车场收费管理系统等,大大地提高了
网格是建立在Internet上的一种新兴的高性能计算平台,能够将各种计算资源整合起来,转化为一种随处可得的、可靠的、经济的计算能力,具有分布性和异构性、共享性和动态性、虚
近几年,智能优化算法倍受人们关注,如人工神经网络、遗传算法,为解决复杂问题提供了新的方法,并在诸多领域取得了成功。组卷问题是一个在一定约束条件下的多目标参数优化问题