论文部分内容阅读
图像分类是模式识别领域的基本问题,在现实世界的生产生活中具有广泛的应用。随着便携式数字成像设备与社交媒体的普及,互联网上的图像数据呈爆炸式增长,在这样的环境下,研究针对大规模图像的分类方法成为了迫切需求。由于数据规模较大,在大规模图像分类中,计算效率,尤其是测试效率成为了影响算法性能的关键因素。此外,图像类别并不是完全孤立的,部分类别之间存在一定的结构关系,如何利用这些结构关系有效地提升大规模图像分类的性能是需要关注的问题。层次学习是将图像类别组织起来进行结构化分类的一种方法,它可以利用大规模图像类别之间的关系构建层次结构,从而大幅度提升图像分类的效率,并且避免数据不平衡问题。多任务学习可以利用任务之间的结构关系对多个相关联的任务进行联合学习,使其性能超过每个任务单独学习。多任务学习的主要问题在于如何分辨相关任务,而层次结构为分辨相关任务提供了良好的环境。基于上述分析,本文从大规模图像数据的特性出发,提出若干层次化多任务学习算法,在提高大规模图像分类准确率的同时提升计算效率。本文的主要创新点如下:1.在处理大规模图像分类任务时,许多现有的浅层分类算法往往将每个图像类别独立处理,从而忽略了图像类别之间的相关性,而且,在面对大规模数据时,浅层算法的计算开销巨大。针对上述问题,本文提出了一种基于增强视觉树的多任务稀疏度量层次学习算法。具体而言,该算法首先构造了一种图像类别表示方法,在此基础上,利用层次聚类算法构建增强视觉树。之后,根据该层次化结构,自上而下地学习层次分类器。其中,利用多任务稀疏度量学习算法训练结点分类器。此外,对于非根结点,利用上层分类器的先验知识帮助结点分类器训练,以提高结点分类器的分辨能力。实验结果表明,该算法在分类准确率上优于其他主流算法,同时,还保持着较高的测试效率。2.在多任务学习中,如何分辨相关任务一直是重要的问题。当相关任务可以被确定时,往往也可以确定非相关任务。一般的多任务学习往往只利用相关任务进行联合学习,而忽略了非相关任务的作用。针对上述缺陷,本文提出了一种同时利用相关与非相关任务的层次度量学习算法。具体而言,该算法利用增强视觉树为分辨相关任务和非相关任务提供了一个良好的环境,根据增强视觉树,自上而下地学习层次分类器。其中,对于非根结点,提出一种同时利用相关与非相关任务的度量学习算法训练结点分类器,帮助结点分类器学习出更具分辨力的距离度量。实验结果表明,利用非相关任务的先验信息,可以有效提升大规模图像分类的准确率。3.一般的层次学习算法主要关注于测试效率的提升问题,然而,当面对大规模图像数据时,训练效率往往会成为算法的瓶颈。针对这一缺陷,本文提出了一种基于多任务支撑向量机的层次学习快速算法。具体而言,该算法利用增强视觉树构建多层次结构并分辨相关任务,利用多任务支撑向量机作为结点分类器,并将层次结构中高层的独立结构向下传播,帮助结点分类器训练。同时,提出了一种多任务支撑向量机的快速算法,提高结点分类器的训练效率,从而提升整个层次学习算法的训练效率。实验结果表明,该算法在保证准确率的前提下,训练效率优于其他主流算法。4.由于室内场景的复杂性和多样性,利用一般彩色图像完成室内场景识别一直是计算机视觉领域的难点问题。随着深度摄像机的普及,利用RGB-D图像完成室内场景识别成为可能。针对该应用场景,本文提出了一种利用层次化多任务度量多核学习算法完成室内场景识别任务的方法。具体而言,首先利用深度神经网络提取彩色图像和深度图像的特征,然后,将使用彩色图像特征进行室内场景识别和使用深度图像特征进行室内场景识别作为两个相关的任务,利用多任务度量学习将两种特征映射到修正空间中,从而提升特征的分辨力。之后,拼接修正空间中的两种特征作为RGB-D图像特征。最后,利用一种层次化多核学习算法作为分类器,完成基于RGB-D图像的场景识别。实验结果表明,该算法可有效提升室内场景识别的准确率。