基于特征表示优化的小样本图像分类

来源 :南京大学 | 被引量 : 0次 | 上传用户:hongjiansu1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
小样本学习是机器学习的一个重要研究方向,聚焦于解决实际应用场景中常见的样本数量短缺的问题。近年来,飞速发展的神经网络为小样本学习各任务的研究带来了新的思路:在计算机视觉领域,目前小样本学习的研究主要聚集在解决小样本图像分类问题上。在这个问题上,学者们依照不同的思路对问题提出了各式各样的解决方案,包括基于扩充数据的、基于模型结构设计的、基于不同形式的推理过程的方法。但是,这些方法大多需要对单个图像以及每个类别进行特征提取,以利用这些特征来进行后续步骤,无论这个特征提取过程是显式的还是隐式的。本文提出的方法即聚焦于解决小样本条件为上述特征提取过程带来的困难。现存的小样本图像分类方法中,性能相对较佳的基于度量的方法通常涉及到用特征空间上的特征向量对每个类别进行表示。而现存的方法在生成此类表示时往往仅使用该类别内全部有标注样本的特征向量的均值或线性组合,这样的做法在容易出现离群点样本的小样本图像分类任务中是缺乏鲁棒性的。为了解决这个问题,本文提出了一种基于多头注意力和类别级全局特征的小样本图像分类方法。另一方面,直推式推理,即对整个无标注样本集而非单个无标注样本进行推理,是针对实际应用场景对小样本图像分类方法做的一种常见的优化;其常见的应用方式是,利用整个无标注样本集的分布作为额外信息,对于小样本图像分类任务中利用到的各种特征表示进行优化。然而,现存的直推式小样本图像分类方法(即利用了直推式推理的小样本图像分类方法)在利用直推式推理过程中获取的无标注样本集分布信息辅助分类过程时,仅考虑了模型对无标注样本给出的分类结果,而不考虑这些分类结果的可靠性/不确定性。本文针对这一问题提出了一种一种基于不确定性的直推式小样本分类方法。具体工作如下:1.为了减轻离群点样本对于类别特征表示的影响,本文提出了一种基于多头注意力和类别级全局特征的小样本图像分类方法,其在模型的训练阶段(现有的小样本分类方法在训练阶段通常会利用一些具有大量样本的类别来构造大量不重复的任务,然后利用元学习的手段训练分类器),采用了具有较强的表达能力的多头注意力机制来构建类别特征提取模块,并引入了各类别的理想的类别特征作为类别特征提取模块的额外监督信息。这样做的目的是希望训练得到的类别特征提取模块能够在只接收每个类别一个或几个样本的信息的情况下输出接近理想状态的类别特征。由于在训练时涉及到的类别的样本量很大,逼近它们的类别级特征的理想状态是可行的。在mini Image Net和tiered Image Net公开数据集上的实验结果表明,通过这种方式训练的方法相比于其他先进的方法能够获得至少等同、至多提高12%的分类准确率。另外,对于前述的“类别特征的理想状态”,本文也对它的计算方法以及合理性作了理论和实验两方面的说明。2.针对现有直推式小样本分类方法不考虑无标注样本分类结果的可靠性的问题,本文提出了一种基于不确定性的直推式小样本分类方法。该方法以一种常见的直推式小样本分类方法结构——即利用无标注样本的伪标签更新类别特征——为基石,在更新类别特征时引入无标注样本分类结果的不确定性来与前者的伪标签共同主导类别特征的更新。方法采用分类结果的互信息来表示不确定性;由于互信息的精确值难以计算,方法通过测试时数据增强的方法为分类过程引入扰动来计算其近似值。在mini Image Net、tiered Image Net、Fewshot-CIFAR100、CIFAR-FS等四个公共数据集上的实验结果显示,该方法的分类准确率相对于大多数先进的直推式和非直推式的小样本分类方法均有大幅提高,具体数值在1.5%-17.7%不等。本文也通过t-SNE可视化的方法定性地说明引入不确定性对直推式小样本分类方法带来的提升。
其他文献
目的以脂多糖(LPS)及三磷酸腺苷(ATP)刺激原代脑微血管内皮细胞(Brain microvascular endothelial cells,BMECs),探讨NLRP3炎症小体相关炎症因子IL-1β和IL-18在原代BMECs中的激活及作用,进一步探讨其与脑小血管病(CSVD)的相关性,为基于免疫炎症寻找新型CSVD的诊疗标记物,从而开发新型治疗CSVD的药物,提供实验依据和理论基础。方法获
在科技日益发达的今天,经济全球化随着网络技术的更新迭代席卷而来,同时,挑战也随之出现,企业能否转型升级以应对更为激烈的竞争,成为企业战略中不可或缺的议题。为增加管理模式的综合效益,企业集团开始选择创新管理模式,采用财务共享服务的新型模式,将非核心业务从分散的组织机构中进行剥离整合统一到专门机构,高效率地规整统一有限资源的最优配置,使企业运营成本逐步下降,经营效率得到提高,防控风险能力进一步增强,企
寨上-马坞矿集区位于西秦岭多金属成矿带,有寨上金矿、马坞金矿、锁龙金矿、新庄里金矿、雪花山钨矿、半沟铅锌矿等矿床产出。前人对寨上-马坞矿集区的地质特征,成矿规律,成矿模式,物化探特征,矿床成因等方面开展了大量深入研究,然而,传统找矿预测方法进展有所减缓,急需一种新方法为该地区找矿预测工作带来新进展以及新思路。人工智能以及NLP(Natural Language Processing)技术在该区域的
学位
学位
学位
中国近代工业建筑是“现代建筑技术的先导”,作为近代时期萌生的“新建筑类型”,不论是建筑历史、结构还是风格都颇具研究意义。刘先觉教授认为“中国近代建筑史应该反映中国新兴工业建筑从无到有发展的历史”,提倡给近代工业建筑一定的地位。自其产生以来,近代工业建筑相关的研究记录众多,但是一直没有关于此类研究的梳理。中国近代工业建筑的研究大致经历了三代建筑学研究者不同程度地推动:第一代研究者中,以梁思成和徐敬直
有机发光二极管(Organic Light-Emitting Diode,OLED)由于其轻薄、宽视角、响应快、亮度高以及可弯曲的优势为照明和显示技术提供了一种新型高效且可持续的方法,并且正在取代市场上的部分技术,例如液晶显示(Liquid Crystal Display,LCD)。OLED有着广泛的商业、医疗以及工业应用。除此之外,OLED在未来可穿戴设备应用中也具有极大的潜力。目前,许多研究都
在土壤的形成过程中,我们通常假设一个自上而下的发育模式,即土壤是由其下基岩风化而形成的。这个模式并没有考虑到风尘对土壤的贡献,而该贡献却是不可忽视的。延伸达上千公里的中国黄土沉积区域反映了风尘对土壤形成的巨大贡献,但在更多非典型风尘沉积带的土壤,风尘贡献研究却严重不足。由于风尘的矿物和化学组成上与上部大陆地壳平均成分有较高的相似性,这让我们对一般土壤中的风尘识别变得困难。玄武岩与风尘在矿物与化学组