论文部分内容阅读
小样本学习是机器学习的一个重要研究方向,聚焦于解决实际应用场景中常见的样本数量短缺的问题。近年来,飞速发展的神经网络为小样本学习各任务的研究带来了新的思路:在计算机视觉领域,目前小样本学习的研究主要聚集在解决小样本图像分类问题上。在这个问题上,学者们依照不同的思路对问题提出了各式各样的解决方案,包括基于扩充数据的、基于模型结构设计的、基于不同形式的推理过程的方法。但是,这些方法大多需要对单个图像以及每个类别进行特征提取,以利用这些特征来进行后续步骤,无论这个特征提取过程是显式的还是隐式的。本文提出的方法即聚焦于解决小样本条件为上述特征提取过程带来的困难。现存的小样本图像分类方法中,性能相对较佳的基于度量的方法通常涉及到用特征空间上的特征向量对每个类别进行表示。而现存的方法在生成此类表示时往往仅使用该类别内全部有标注样本的特征向量的均值或线性组合,这样的做法在容易出现离群点样本的小样本图像分类任务中是缺乏鲁棒性的。为了解决这个问题,本文提出了一种基于多头注意力和类别级全局特征的小样本图像分类方法。另一方面,直推式推理,即对整个无标注样本集而非单个无标注样本进行推理,是针对实际应用场景对小样本图像分类方法做的一种常见的优化;其常见的应用方式是,利用整个无标注样本集的分布作为额外信息,对于小样本图像分类任务中利用到的各种特征表示进行优化。然而,现存的直推式小样本图像分类方法(即利用了直推式推理的小样本图像分类方法)在利用直推式推理过程中获取的无标注样本集分布信息辅助分类过程时,仅考虑了模型对无标注样本给出的分类结果,而不考虑这些分类结果的可靠性/不确定性。本文针对这一问题提出了一种一种基于不确定性的直推式小样本分类方法。具体工作如下:1.为了减轻离群点样本对于类别特征表示的影响,本文提出了一种基于多头注意力和类别级全局特征的小样本图像分类方法,其在模型的训练阶段(现有的小样本分类方法在训练阶段通常会利用一些具有大量样本的类别来构造大量不重复的任务,然后利用元学习的手段训练分类器),采用了具有较强的表达能力的多头注意力机制来构建类别特征提取模块,并引入了各类别的理想的类别特征作为类别特征提取模块的额外监督信息。这样做的目的是希望训练得到的类别特征提取模块能够在只接收每个类别一个或几个样本的信息的情况下输出接近理想状态的类别特征。由于在训练时涉及到的类别的样本量很大,逼近它们的类别级特征的理想状态是可行的。在mini Image Net和tiered Image Net公开数据集上的实验结果表明,通过这种方式训练的方法相比于其他先进的方法能够获得至少等同、至多提高12%的分类准确率。另外,对于前述的“类别特征的理想状态”,本文也对它的计算方法以及合理性作了理论和实验两方面的说明。2.针对现有直推式小样本分类方法不考虑无标注样本分类结果的可靠性的问题,本文提出了一种基于不确定性的直推式小样本分类方法。该方法以一种常见的直推式小样本分类方法结构——即利用无标注样本的伪标签更新类别特征——为基石,在更新类别特征时引入无标注样本分类结果的不确定性来与前者的伪标签共同主导类别特征的更新。方法采用分类结果的互信息来表示不确定性;由于互信息的精确值难以计算,方法通过测试时数据增强的方法为分类过程引入扰动来计算其近似值。在mini Image Net、tiered Image Net、Fewshot-CIFAR100、CIFAR-FS等四个公共数据集上的实验结果显示,该方法的分类准确率相对于大多数先进的直推式和非直推式的小样本分类方法均有大幅提高,具体数值在1.5%-17.7%不等。本文也通过t-SNE可视化的方法定性地说明引入不确定性对直推式小样本分类方法带来的提升。